Qwen 2.5 Coder 32B

Alibaba · 32 Mrd. Parameter · Apache-2.0

Code-spezialisierter Qwen. Vergleichbar mit GPT-4 für Code. Apache-2.0.

Lizenz: Apache-2.0. Apache 2.0 ist eine der permissivsten Open-Source-Lizenzen — kommerzielle Nutzung, Modifikation und Weiterverbreitung uneingeschränkt erlaubt, inklusive Patent-Klausel. Das macht Qwen 2.5 Coder 32B besonders interessant für On-Prem-Deployments in Unternehmen, kommerzielle SaaS-Produkte und Embedded-Lösungen.

Mit 32 Mrd. Parametern braucht Qwen 2.5 Coder 32B echte Workstation-Hardware: Q4_K_M belegt etwa 21 GB VRAM. RTX 3090 oder 4090 (24 GB) sind das Minimum, RTX 6000 Ada (48 GB) gibt komfortablen Headroom. Apple Mac Studio M4 Max oder M3 Ultra sind die produktivste Mac-Option.

Mit 128k Tokens Kontext (~96k Wörter) eignet sich Qwen 2.5 Coder 32B für lange Texte, Multi-Dokument-RAG und umfangreiche System-Prompts ohne Chunking-Overhead.

Parameter

32 B

Lizenz

Apache-2.0

Wirklich offen?

✓ ja

Deutsch-Qualität

n/a

Kontextfenster

128k Tokens

Vendor

Alibaba

Release

12.11.2024

Familie

Qwen

Auf Hugging Face öffnen

Qwen 2.5 Coder 32B lokal: Welche GPU brauche ich?

16 GPUs können Qwen 2.5 Coder 32B in mindestens einer praktikablen Quantisierung fahren — sortiert nach VRAM-Kapazität. Tokens/Sek-Werte werden manuell aus Community-Benchmarks gepflegt (siehe Confidence-Badges auf den Detailseiten).

GPU	Beste Quant	VRAM-Bedarf
Apple Mac Studio M3 Ultra 192GB	Q8_0	34.5 GB
Apple MacBook Pro M4 Max 128GB	Q8_0	34.5 GB
Apple Mac Studio M3 Ultra 96GB	Q8_0	34.5 GB
NVIDIA H100 80GB	Q8_0	34.5 GB
Apple Mac mini M4 Pro 64GB	Q8_0	34.5 GB
Apple MacBook Pro M4 Max 64GB	Q8_0	34.5 GB
NVIDIA L40S	Q8_0	34.5 GB
NVIDIA RTX 6000 Ada Generation	Q8_0	34.5 GB
NVIDIA RTX A6000	Q8_0	34.5 GB
NVIDIA GeForce RTX 5090	Q4_K_M	20.9 GB
AMD Radeon RX 7900 XTX	Q4_K_M	20.9 GB
NVIDIA GeForce RTX 3090 Ti	Q4_K_M	20.9 GB
NVIDIA GeForce RTX 3090	Q4_K_M	20.9 GB
NVIDIA GeForce RTX 4090	Q4_K_M	20.9 GB
NVIDIA Tesla M40 24GB	Q4_K_M	20.9 GB
NVIDIA Tesla P40	Q4_K_M	20.9 GB