GPT-4o mini

OpenAI · 8 Mrd. Parameter · proprietary

Kleines Closed-Model — günstigste Cloud-Alternative für einfache Tasks.

Lizenz: proprietary. Proprietäres Modell — nicht lokal lauffähig, nur über die Hersteller-API. Das macht GPT-4o mini besonders interessant für spezifische Workloads über die Anbieter-API — lokales Hosten ist nicht vorgesehen.

GPT-4o mini hat 8 Mrd. Parameter und braucht in Q4_K_M-Quantisierung rund 6-7 GB VRAM. Damit läuft das Modell auf praktisch jeder modernen GPU ab RTX 3060 12GB aufwärts. Apple-Silicon-Geräte mit 16+ GB Unified Memory sind ebenfalls bestens geeignet.

Das Kontextfenster von 125k Tokens ist solide für die meisten produktiven Use-Cases, aber knapp für sehr lange Dokumente oder umfangreiches RAG ohne sauberes Chunking.

Deutsch-Qualität: gut. Solide deutsche Ausgabe für die meisten produktiven Use-Cases — gelegentlich englische Phrasen oder leichte Holprigkeiten, aber überzeugend.

Parameter

8 B

Lizenz

proprietary

Wirklich offen?

⚠ Restriktionen

Deutsch-Qualität

gut

Kontextfenster

125k Tokens

Vendor

OpenAI

Release

18.7.2024

Familie

GPT

GPT-4o mini ist nicht lokal lauffähig.

Als proprietäres Closed-Source-Modell ist GPT-4o mini ausschließlich über die Hersteller-API verfügbar — Gewichte können nicht heruntergeladen, quantisiert oder auf eigener Hardware ausgeführt werden. Vergleiche stattdessen die Cloud-Preise unten, oder schau dir offene Modelle in vergleichbarer Größe an.

GPT-4o mini API: Cloud-Anbieter im Vergleich

1 Anbieter hosten dieses Modell. Sortiert nach Input-Preis. EU-Hosting-Spalte zeigt DSGVO-relevante Optionen.

Anbieter	EU-Hosting	Input €/1M	Output €/1M
OpenAI	✓	0.14	0.55