KI-Rundschau

Welche GPU für Qwen 2.5 Coder 32B lokal?

Qwen 2.5 Coder 32B hat 32 Mrd. Parameter. Diese GPUs können das Modell in mindestens einer praktikablen Quantisierung fahren — sortiert nach Preis pro GB VRAM.

GPUbeste QuantVRAM-BedarfTokens/SekPreis€/GB
AMD Radeon RX 7900 XTXQ4_K_M20.9 GB
Apple Mac mini M4 Pro 64GBQ8_034.5 GB
Apple Mac Studio M3 Ultra 192GBQ8_034.5 GB
Apple Mac Studio M3 Ultra 96GBQ8_034.5 GB
Apple MacBook Pro M4 Max 128GBQ8_034.5 GB
Apple MacBook Pro M4 Max 64GBQ8_034.5 GB
NVIDIA H100 80GBQ8_034.5 GB
NVIDIA L40SQ8_034.5 GB
NVIDIA GeForce RTX 3090 TiQ4_K_M20.9 GB
NVIDIA GeForce RTX 3090Q4_K_M20.9 GB
NVIDIA GeForce RTX 4090Q4_K_M20.9 GB
NVIDIA GeForce RTX 5090Q4_K_M20.9 GB
NVIDIA RTX 6000 Ada GenerationQ8_034.5 GB
NVIDIA RTX A6000Q8_034.5 GB
NVIDIA Tesla M40 24GBQ4_K_M20.9 GB
NVIDIA Tesla P40Q4_K_M20.9 GB