Phi-4 14B
Microsoft · 14 Mrd. Parameter · MIT
Microsofts 14B-Modell. MIT. Trainiert auf synthetischen Daten — sehr gut in Reasoning aber weniger Weltwissen.
Lizenz: MIT. Die MIT-Lizenz erlaubt jegliche Nutzung, Modifikation und Verbreitung ohne nennenswerte Einschränkungen — kommerzielles Hosting eingeschlossen. Das macht Phi-4 14B besonders interessant für On-Prem-Deployments in Unternehmen, kommerzielle SaaS-Produkte und Embedded-Lösungen.
Mit 14 Mrd. Parametern positioniert sich Phi-4 14B im mittleren Segment. Q4_K_M-Quantisierung braucht etwa 10 GB VRAM — RTX 3060 12GB ist die untere Grenze, RTX 4080 Super (16GB) oder 4090 (24GB) der Komfort-Bereich. Auf Mac mini M4 mit 16+ GB Unified Memory ebenfalls flüssig.
Mit nur 16k Tokens Kontext ist Phi-4 14B auf kürzere Eingaben ausgelegt — für lange Dokumente brauchst du Chunking-Strategien.
Deutsch-Qualität: mittel. Verständlich auf Deutsch, aber spürbar englisch-trainiert — Stilebenen-Übergänge sind nicht immer sauber, fachsprachlich limitiert.
Phi-4 14B lokal: Welche GPU brauche ich?
22 GPUs können Phi-4 14B in mindestens einer praktikablen Quantisierung fahren — sortiert nach VRAM-Kapazität. Tokens/Sek-Werte werden manuell aus Community-Benchmarks gepflegt (siehe Confidence-Badges auf den Detailseiten).
| GPU | Beste Quant | VRAM-Bedarf |
|---|---|---|
| Apple Mac Studio M3 Ultra 192GB | Q8_0 | 15.9 GB |
| Apple MacBook Pro M4 Max 128GB | Q8_0 | 15.9 GB |
| Apple Mac Studio M3 Ultra 96GB | Q8_0 | 15.9 GB |
| NVIDIA H100 80GB | Q8_0 | 15.9 GB |
| Apple Mac mini M4 Pro 64GB | Q8_0 | 15.9 GB |
| Apple MacBook Pro M4 Max 64GB | Q8_0 | 15.9 GB |
| NVIDIA L40S | Q8_0 | 15.9 GB |
| NVIDIA RTX 6000 Ada Generation | Q8_0 | 15.9 GB |
| NVIDIA RTX A6000 | Q8_0 | 15.9 GB |
| NVIDIA GeForce RTX 5090 | Q8_0 | 15.9 GB |
| AMD Radeon RX 7900 XTX | Q8_0 | 15.9 GB |
| NVIDIA GeForce RTX 3090 Ti | Q8_0 | 15.9 GB |
| NVIDIA GeForce RTX 3090 | Q8_0 | 15.9 GB |
| NVIDIA GeForce RTX 4090 | Q8_0 | 15.9 GB |
| NVIDIA Tesla M40 24GB | Q8_0 | 15.9 GB |
| NVIDIA Tesla P40 | Q8_0 | 15.9 GB |
| AMD Radeon RX 7900 XT | Q8_0 | 15.9 GB |
| Intel Arc A770 16GB | Q4_K_M | 9.9 GB |
| NVIDIA GeForce RTX 4070 Ti Super | Q4_K_M | 9.9 GB |
| NVIDIA GeForce RTX 4080 Super | Q4_K_M | 9.9 GB |
| NVIDIA GeForce RTX 5080 | Q4_K_M | 9.9 GB |
| NVIDIA GeForce RTX 3060 12GB | Q4_K_M | 9.9 GB |
