KI-Rundschau

GPUs für lokale KI

Wer Sprachmodelle (LLMs) lokal betreiben will, scheitert meist nicht an der Rechenleistung in TFLOPs, sondern am verfügbaren VRAM. Ein Llama-3.3-70B-Modell braucht in Q4_K_M-Quantisierung rund 43 GB Speicher — die meisten Consumer-GPUs sind damit überfordert.

Diese Datenbank listet die relevantesten Grafikkarten und Apple-Silicon-Rechner für KI-Inferenz im DACH-Raum: NVIDIA Consumer (RTX 4090, 5090), Pro/Datacenter (RTX 6000 Ada, L40S, H100), Gebraucht-Helden (RTX 3090, Tesla P40), AMD RDNA 3, Apple Unified Memory bis 192 GB sowie Intel Arc. Sortiert nach VRAM-Kapazität — dem wichtigsten Kriterium für lokale LLMs.

Nicht sicher, welche GPU die richtige ist?

Unsere ausführliche Kaufberatung für KMU mit drei konkreten Setup-Empfehlungen und TCO-Rechnung hilft bei der Entscheidung zwischen 24 GB / 48 GB / 96 GB-Setup.

GPUVRAMBandbreiteTDPMarkt
Apple Mac Studio M3 Ultra 192GB192 GB819 GB/s270 WConsumer
Apple MacBook Pro M4 Max 128GB128 GB546 GB/s140 WConsumer
Apple Mac Studio M3 Ultra 96GB96 GB819 GB/s270 WConsumer
NVIDIA H100 80GB80 GB3350 GB/s700 WDatacenter
Apple MacBook Pro M4 Max 64GB64 GB546 GB/s140 WConsumer
Apple Mac mini M4 Pro 64GB64 GB273 GB/s65 WConsumer
NVIDIA RTX 6000 Ada Generation48 GB960 GB/s300 WDatacenter
NVIDIA L40S48 GB864 GB/s350 WDatacenter
NVIDIA RTX A600048 GB768 GB/s300 WDatacenter
NVIDIA GeForce RTX 509032 GB1792 GB/s575 WConsumer
NVIDIA GeForce RTX 3090 Ti24 GB1008 GB/s450 Wgebraucht
NVIDIA GeForce RTX 409024 GB1008 GB/s450 WConsumer
AMD Radeon RX 7900 XTX24 GB960 GB/s355 WConsumer
NVIDIA GeForce RTX 309024 GB936 GB/s350 Wgebraucht
NVIDIA Tesla P4024 GB347 GB/s250 Wgebraucht
NVIDIA Tesla M40 24GB24 GB288 GB/s250 Wgebraucht
AMD Radeon RX 7900 XT20 GB800 GB/s315 WConsumer
NVIDIA GeForce RTX 508016 GB960 GB/s360 WConsumer
NVIDIA GeForce RTX 4080 Super16 GB736 GB/s320 WConsumer
NVIDIA GeForce RTX 4070 Ti Super16 GB672 GB/s285 WConsumer
Intel Arc A770 16GB16 GB560 GB/s225 WConsumer
NVIDIA GeForce RTX 3060 12GB12 GB360 GB/s170 WConsumer

Preise werden manuell gepflegt — aktuell unvollständig, daher ausgeblendet. Auf den Detailseiten siehst du Affiliate-Links zu den jeweiligen Shops.