KI-Rundschau

Inferenz-Preisvergleich für LLM-APIs

Cloud-LLM-APIs unterscheiden sich um den Faktor 50 im Preis pro Million Tokens — von 0,05 € bei DeepInfra bis 13,80 € für Claude 3.5 Sonnet Output. Wer in Produktion geht, sollte vor der Anbieterwahl wissen, wo die eigenen Daten landen.

Diese Tabelle listet 12 Provider mit DSGVO-relevanten Attributen: EU-Hosting, AVV verfügbar, Datenresidenz. Genau die Information, die in den offiziellen Pricing-Pages meist auf Seite 3 steht — oder gar nicht.

Cloud-API oder eigene GPU?

Konkretes Beispiel: 100 Mio. Tokens pro Monat über GPT-4o kosten rund 230 € Input + 920 € Output = 1.150 € / Monat. Eine RTX-4090-Workstation (ca. 2.500 € Einmalig + 30 €/Monat Strom) hat sich nach ~3 Monaten amortisiert.

Eigene Hardware lohnt bei hohem konstantem Volumen und sensiblen Daten. Cloud bleibt sinnvoll für Spitzen und multimodale Frontier-Modelle (GPT-4o, Claude Sonnet). Mehr dazu im Pillar-Artikel zu RAG mit eigenen Daten →

🇪🇺 EU-Hosting-Anbieter (DSGVO-freundlich)

AnbieterHQResidenzAVVAb €/1M InputModelle
IONOS AI Model HubDEEU-only0.18 €2
Mistral AIFREU-only0.18 €1
NebiusNLEU-only0.18 €2
OVHcloud AI EndpointsFREU-only0.18 €2
OpenAIUSconfigurable0.14 €2

🌍 Globale Anbieter (kein dediziertes EU-Hosting)

AnbieterHQResidenzAVVAb €/1M InputModelle
AnthropicUSus-only0.92 €2
DeepInfraUSus-only0.05 €3
DeepSeekCNchina-only0.50 €1
Fireworks AIUSus-default0.18 €3
GroqUSus-only0.05 €2
OpenRouterUSconfigurable0.13 €2
Together AIUSus-default0.17 €3

Alle Preise in EUR pro 1 Mio. Tokens. USD-Konvertierung mit Kurs ~0.92. Preisstand-Drift-Detection läuft wöchentlich — Detailseite zeigt jeweils Quell-URL und letztes Verifikationsdatum.