DeepSeek R1 Distill Qwen 32B
DeepSeek · 32 Mrd. Parameter · MIT
Reasoning-Distill aus DeepSeek R1 auf Qwen 2.5 32B Basis. MIT-Lizenz. Stark in Mathe/Code.
Lizenz: MIT. Die MIT-Lizenz erlaubt jegliche Nutzung, Modifikation und Verbreitung ohne nennenswerte Einschränkungen — kommerzielles Hosting eingeschlossen. Das macht DeepSeek R1 Distill Qwen 32B besonders interessant für On-Prem-Deployments in Unternehmen, kommerzielle SaaS-Produkte und Embedded-Lösungen.
Mit 32 Mrd. Parametern braucht DeepSeek R1 Distill Qwen 32B echte Workstation-Hardware: Q4_K_M belegt etwa 21 GB VRAM. RTX 3090 oder 4090 (24 GB) sind das Minimum, RTX 6000 Ada (48 GB) gibt komfortablen Headroom. Apple Mac Studio M4 Max oder M3 Ultra sind die produktivste Mac-Option.
Mit 128k Tokens Kontext (~96k Wörter) eignet sich DeepSeek R1 Distill Qwen 32B für lange Texte, Multi-Dokument-RAG und umfangreiche System-Prompts ohne Chunking-Overhead.
Deutsch-Qualität: gut. Solide deutsche Ausgabe für die meisten produktiven Use-Cases — gelegentlich englische Phrasen oder leichte Holprigkeiten, aber überzeugend.
DeepSeek R1 Distill Qwen 32B lokal: Welche GPU brauche ich?
16 GPUs können DeepSeek R1 Distill Qwen 32B in mindestens einer praktikablen Quantisierung fahren — sortiert nach VRAM-Kapazität. Tokens/Sek-Werte werden manuell aus Community-Benchmarks gepflegt (siehe Confidence-Badges auf den Detailseiten).
| GPU | Beste Quant | VRAM-Bedarf |
|---|---|---|
| Apple Mac Studio M3 Ultra 192GB | Q8_0 | 34.5 GB |
| Apple MacBook Pro M4 Max 128GB | Q8_0 | 34.5 GB |
| Apple Mac Studio M3 Ultra 96GB | Q8_0 | 34.5 GB |
| NVIDIA H100 80GB | Q8_0 | 34.5 GB |
| Apple Mac mini M4 Pro 64GB | Q8_0 | 34.5 GB |
| Apple MacBook Pro M4 Max 64GB | Q8_0 | 34.5 GB |
| NVIDIA L40S | Q8_0 | 34.5 GB |
| NVIDIA RTX 6000 Ada Generation | Q8_0 | 34.5 GB |
| NVIDIA RTX A6000 | Q8_0 | 34.5 GB |
| NVIDIA GeForce RTX 5090 | Q4_K_M | 20.9 GB |
| AMD Radeon RX 7900 XTX | Q4_K_M | 20.9 GB |
| NVIDIA GeForce RTX 3090 Ti | Q4_K_M | 20.9 GB |
| NVIDIA GeForce RTX 3090 | Q4_K_M | 20.9 GB |
| NVIDIA GeForce RTX 4090 | Q4_K_M | 20.9 GB |
| NVIDIA Tesla M40 24GB | Q4_K_M | 20.9 GB |
| NVIDIA Tesla P40 | Q4_K_M | 20.9 GB |
DeepSeek R1 Distill Qwen 32B API: Cloud-Anbieter im Vergleich
1 Anbieter hosten dieses Modell. Sortiert nach Input-Preis. EU-Hosting-Spalte zeigt DSGVO-relevante Optionen.
| Anbieter | EU-Hosting | Input €/1M | Output €/1M |
|---|---|---|---|
| DeepSeek | — | 0.50 | 2.00 |
