Claude 3.5 Haiku
Anthropic · 20 Mrd. Parameter · proprietary
Anthropic's günstiges Modell.
Lizenz: proprietary. Proprietäres Modell — nicht lokal lauffähig, nur über die Hersteller-API. Das macht Claude 3.5 Haiku besonders interessant für spezifische Workloads über die Anbieter-API — lokales Hosten ist nicht vorgesehen.
Claude 3.5 Haiku liegt mit 20 Mrd. Parametern in der Klasse, die 16+ GB VRAM voraussetzt. Q4_K_M braucht ca. 16-18 GB — eine RTX 4080 Super oder RTX 4090 ist hier Pflicht. Apple Mac Studio M4 Max mit 64 GB Unified Memory ist die produktivste lokale Plattform.
Mit 195k Tokens Kontext (~146k Wörter) eignet sich Claude 3.5 Haiku für lange Texte, Multi-Dokument-RAG und umfangreiche System-Prompts ohne Chunking-Overhead.
Deutsch-Qualität: gut. Solide deutsche Ausgabe für die meisten produktiven Use-Cases — gelegentlich englische Phrasen oder leichte Holprigkeiten, aber überzeugend.
Als proprietäres Closed-Source-Modell ist Claude 3.5 Haiku ausschließlich über die Hersteller-API verfügbar — Gewichte können nicht heruntergeladen, quantisiert oder auf eigener Hardware ausgeführt werden. Vergleiche stattdessen die Cloud-Preise unten, oder schau dir offene Modelle in vergleichbarer Größe an.
Claude 3.5 Haiku API: Cloud-Anbieter im Vergleich
1 Anbieter hosten dieses Modell. Sortiert nach Input-Preis. EU-Hosting-Spalte zeigt DSGVO-relevante Optionen.
| Anbieter | EU-Hosting | Input €/1M | Output €/1M |
|---|---|---|---|
| Anthropic | — | 0.92 | 4.60 |
