KI-Rundschau

DeepInfra

US · Kein EU-Hosting · us-only

DeepInfra ist ein globaler Inferenz-Provider mit Hauptsitz in US. Sehr günstig für Open-Weights. US-Hosting.

DSGVO-kritischer Hinweis: DeepInfra hat US-zentrische Datenhaltung — für personenbezogene Daten europäischer Nutzer braucht es Vertragsklauseln (SCC) und Risikoabwägung. AVV nicht verfügbar.

Die Preistabelle unten zeigt €/1M Input- und Output-Tokens. Bedenke: Output ist meist 3-4× teurer als Input — bei chatlastigen Use-Cases mit langen Antworten entsteht der Großteil der Kosten hier. Für TCO-Vergleich mit lokaler Hardware nutze die GPU-Übersicht.

HQ
US
EU-Hosting
nein
AVV verfügbar
nein
Datenresidenz
us-only
EU-Hosting: US-Cloud

DeepInfra Preise — €/1M Token

ModellInput €/1MOutput €/1MKontextQuelle
Llama 3.1 8B0.050.05128kPricing-Page
Qwen 2.5 32B0.130.24128kPricing-Page
Llama 3.3 70B0.210.37128kPricing-Page
Offizielle Pricing-Page