Inferenz-Preisvergleich für LLM-APIs
Cloud-LLM-APIs unterscheiden sich um den Faktor 50 im Preis pro Million Tokens — von 0,05 € bei DeepInfra bis 13,80 € für Claude 3.5 Sonnet Output. Wer in Produktion geht, sollte vor der Anbieterwahl wissen, wo die eigenen Daten landen.
Diese Tabelle listet 12 Provider mit DSGVO-relevanten Attributen: EU-Hosting, AVV verfügbar, Datenresidenz. Genau die Information, die in den offiziellen Pricing-Pages meist auf Seite 3 steht — oder gar nicht.
Konkretes Beispiel: 100 Mio. Tokens pro Monat über GPT-4o kosten rund 230 € Input + 920 € Output = 1.150 € / Monat. Eine RTX-4090-Workstation (ca. 2.500 € Einmalig + 30 €/Monat Strom) hat sich nach ~3 Monaten amortisiert.
Eigene Hardware lohnt bei hohem konstantem Volumen und sensiblen Daten. Cloud bleibt sinnvoll für Spitzen und multimodale Frontier-Modelle (GPT-4o, Claude Sonnet). Mehr dazu im Pillar-Artikel zu RAG mit eigenen Daten →
🇪🇺 EU-Hosting-Anbieter (DSGVO-freundlich)
| Anbieter | HQ | Residenz | AVV | Ab €/1M Input | Modelle |
|---|---|---|---|---|---|
| IONOS AI Model Hub | DE | EU-only | ✓ | 0.18 € | 2 |
| Mistral AI | FR | EU-only | ✓ | 0.18 € | 1 |
| Nebius | NL | EU-only | ✓ | 0.18 € | 2 |
| OVHcloud AI Endpoints | FR | EU-only | ✓ | 0.18 € | 2 |
| OpenAI | US | configurable | ✓ | 0.14 € | 2 |
🌍 Globale Anbieter (kein dediziertes EU-Hosting)
| Anbieter | HQ | Residenz | AVV | Ab €/1M Input | Modelle |
|---|---|---|---|---|---|
| Anthropic | US | us-only | ✓ | 0.92 € | 2 |
| DeepInfra | US | us-only | — | 0.05 € | 3 |
| DeepSeek | CN | china-only | — | 0.50 € | 1 |
| Fireworks AI | US | us-default | — | 0.18 € | 3 |
| Groq | US | us-only | — | 0.05 € | 2 |
| OpenRouter | US | configurable | — | 0.13 € | 2 |
| Together AI | US | us-default | — | 0.17 € | 3 |
Alle Preise in EUR pro 1 Mio. Tokens. USD-Konvertierung mit Kurs ~0.92. Preisstand-Drift-Detection läuft wöchentlich — Detailseite zeigt jeweils Quell-URL und letztes Verifikationsdatum.
