KI-Rundschau

Phi-4 14B

Microsoft · 14 Mrd. Parameter · MIT

Microsofts 14B-Modell. MIT. Trainiert auf synthetischen Daten — sehr gut in Reasoning aber weniger Weltwissen.

Lizenz: MIT. Die MIT-Lizenz erlaubt jegliche Nutzung, Modifikation und Verbreitung ohne nennenswerte Einschränkungen — kommerzielles Hosting eingeschlossen. Das macht Phi-4 14B besonders interessant für On-Prem-Deployments in Unternehmen, kommerzielle SaaS-Produkte und Embedded-Lösungen.

Mit 14 Mrd. Parametern positioniert sich Phi-4 14B im mittleren Segment. Q4_K_M-Quantisierung braucht etwa 10 GB VRAM — RTX 3060 12GB ist die untere Grenze, RTX 4080 Super (16GB) oder 4090 (24GB) der Komfort-Bereich. Auf Mac mini M4 mit 16+ GB Unified Memory ebenfalls flüssig.

Mit nur 16k Tokens Kontext ist Phi-4 14B auf kürzere Eingaben ausgelegt — für lange Dokumente brauchst du Chunking-Strategien.

Deutsch-Qualität: mittel. Verständlich auf Deutsch, aber spürbar englisch-trainiert — Stilebenen-Übergänge sind nicht immer sauber, fachsprachlich limitiert.

Parameter
14 B
Lizenz
MIT
Wirklich offen?
✓ ja
Deutsch-Qualität
mittel
Kontextfenster
16k Tokens
Vendor
Microsoft
Release
12.12.2024
Familie
Phi
Auf Hugging Face öffnen

Phi-4 14B lokal: Welche GPU brauche ich?

22 GPUs können Phi-4 14B in mindestens einer praktikablen Quantisierung fahren — sortiert nach VRAM-Kapazität. Tokens/Sek-Werte werden manuell aus Community-Benchmarks gepflegt (siehe Confidence-Badges auf den Detailseiten).

GPUBeste QuantVRAM-Bedarf
Apple Mac Studio M3 Ultra 192GBQ8_015.9 GB
Apple MacBook Pro M4 Max 128GBQ8_015.9 GB
Apple Mac Studio M3 Ultra 96GBQ8_015.9 GB
NVIDIA H100 80GBQ8_015.9 GB
Apple Mac mini M4 Pro 64GBQ8_015.9 GB
Apple MacBook Pro M4 Max 64GBQ8_015.9 GB
NVIDIA L40SQ8_015.9 GB
NVIDIA RTX 6000 Ada GenerationQ8_015.9 GB
NVIDIA RTX A6000Q8_015.9 GB
NVIDIA GeForce RTX 5090Q8_015.9 GB
AMD Radeon RX 7900 XTXQ8_015.9 GB
NVIDIA GeForce RTX 3090 TiQ8_015.9 GB
NVIDIA GeForce RTX 3090Q8_015.9 GB
NVIDIA GeForce RTX 4090Q8_015.9 GB
NVIDIA Tesla M40 24GBQ8_015.9 GB
NVIDIA Tesla P40Q8_015.9 GB
AMD Radeon RX 7900 XTQ8_015.9 GB
Intel Arc A770 16GBQ4_K_M9.9 GB
NVIDIA GeForce RTX 4070 Ti SuperQ4_K_M9.9 GB
NVIDIA GeForce RTX 4080 SuperQ4_K_M9.9 GB
NVIDIA GeForce RTX 5080Q4_K_M9.9 GB
NVIDIA GeForce RTX 3060 12GBQ4_K_M9.9 GB