KI-Rundschau

Qwen 2.5 32B

Alibaba · 32 Mrd. Parameter · Apache-2.0

Stärkstes offenes Modell mit echter Apache-2.0-Lizenz in dieser Größe. Multilinguales Training inkl. Deutsch.

Lizenz: Apache-2.0. Apache 2.0 ist eine der permissivsten Open-Source-Lizenzen — kommerzielle Nutzung, Modifikation und Weiterverbreitung uneingeschränkt erlaubt, inklusive Patent-Klausel. Das macht Qwen 2.5 32B besonders interessant für On-Prem-Deployments in Unternehmen, kommerzielle SaaS-Produkte und Embedded-Lösungen.

Mit 32 Mrd. Parametern braucht Qwen 2.5 32B echte Workstation-Hardware: Q4_K_M belegt etwa 21 GB VRAM. RTX 3090 oder 4090 (24 GB) sind das Minimum, RTX 6000 Ada (48 GB) gibt komfortablen Headroom. Apple Mac Studio M4 Max oder M3 Ultra sind die produktivste Mac-Option.

Mit 128k Tokens Kontext (~96k Wörter) eignet sich Qwen 2.5 32B für lange Texte, Multi-Dokument-RAG und umfangreiche System-Prompts ohne Chunking-Overhead.

Deutsch-Qualität: exzellent. Praktisch nicht von Frontier-Cloud-Modellen unterscheidbar in der deutschen Ausgabe — kohärent, idiomatisch, fachlich korrekt.

Parameter
32 B
Lizenz
Apache-2.0
Wirklich offen?
✓ ja
Deutsch-Qualität
exzellent
Kontextfenster
128k Tokens
Vendor
Alibaba
Release
18.9.2024
Familie
Qwen
Auf Hugging Face öffnen

Qwen 2.5 32B lokal: Welche GPU brauche ich?

16 GPUs können Qwen 2.5 32B in mindestens einer praktikablen Quantisierung fahren — sortiert nach VRAM-Kapazität. Tokens/Sek-Werte werden manuell aus Community-Benchmarks gepflegt (siehe Confidence-Badges auf den Detailseiten).

GPUBeste QuantVRAM-Bedarf
Apple Mac Studio M3 Ultra 192GBQ8_034.5 GB
Apple MacBook Pro M4 Max 128GBQ8_034.5 GB
Apple Mac Studio M3 Ultra 96GBQ8_034.5 GB
NVIDIA H100 80GBQ8_034.5 GB
Apple Mac mini M4 Pro 64GBQ8_034.5 GB
Apple MacBook Pro M4 Max 64GBQ8_034.5 GB
NVIDIA L40SQ8_034.5 GB
NVIDIA RTX 6000 Ada GenerationQ8_034.5 GB
NVIDIA RTX A6000Q8_034.5 GB
NVIDIA GeForce RTX 5090Q4_K_M20.9 GB
AMD Radeon RX 7900 XTXQ4_K_M20.9 GB
NVIDIA GeForce RTX 3090 TiQ4_K_M20.9 GB
NVIDIA GeForce RTX 3090Q4_K_M20.9 GB
NVIDIA GeForce RTX 4090Q4_K_M20.9 GB
NVIDIA Tesla M40 24GBQ4_K_M20.9 GB
NVIDIA Tesla P40Q4_K_M20.9 GB

Qwen 2.5 32B API: Cloud-Anbieter im Vergleich

5 Anbieter hosten dieses Modell. Sortiert nach Input-Preis. EU-Hosting-Spalte zeigt DSGVO-relevante Optionen.

AnbieterEU-HostingInput €/1MOutput €/1M
DeepInfra0.130.24
OpenRouter0.130.24
Nebius0.180.55
Together AI0.740.74
Fireworks AI0.830.83