GPUs für lokale KI
Wer Sprachmodelle (LLMs) lokal betreiben will, scheitert meist nicht an der Rechenleistung in TFLOPs, sondern am verfügbaren VRAM. Ein Llama-3.3-70B-Modell braucht in Q4_K_M-Quantisierung rund 43 GB Speicher — die meisten Consumer-GPUs sind damit überfordert.
Diese Datenbank listet die relevantesten Grafikkarten und Apple-Silicon-Rechner für KI-Inferenz im DACH-Raum: NVIDIA Consumer (RTX 4090, 5090), Pro/Datacenter (RTX 6000 Ada, L40S, H100), Gebraucht-Helden (RTX 3090, Tesla P40), AMD RDNA 3, Apple Unified Memory bis 192 GB sowie Intel Arc. Sortiert nach VRAM-Kapazität — dem wichtigsten Kriterium für lokale LLMs.
Unsere ausführliche Kaufberatung für KMU mit drei konkreten Setup-Empfehlungen und TCO-Rechnung hilft bei der Entscheidung zwischen 24 GB / 48 GB / 96 GB-Setup.
| GPU | VRAM | Bandbreite | TDP | Markt |
|---|---|---|---|---|
| Apple Mac Studio M3 Ultra 192GB | 192 GB | 819 GB/s | 270 W | Consumer |
| Apple MacBook Pro M4 Max 128GB | 128 GB | 546 GB/s | 140 W | Consumer |
| Apple Mac Studio M3 Ultra 96GB | 96 GB | 819 GB/s | 270 W | Consumer |
| NVIDIA H100 80GB | 80 GB | 3350 GB/s | 700 W | Datacenter |
| Apple MacBook Pro M4 Max 64GB | 64 GB | 546 GB/s | 140 W | Consumer |
| Apple Mac mini M4 Pro 64GB | 64 GB | 273 GB/s | 65 W | Consumer |
| NVIDIA RTX 6000 Ada Generation | 48 GB | 960 GB/s | 300 W | Datacenter |
| NVIDIA L40S | 48 GB | 864 GB/s | 350 W | Datacenter |
| NVIDIA RTX A6000 | 48 GB | 768 GB/s | 300 W | Datacenter |
| NVIDIA GeForce RTX 5090 | 32 GB | 1792 GB/s | 575 W | Consumer |
| NVIDIA GeForce RTX 3090 Ti | 24 GB | 1008 GB/s | 450 W | gebraucht |
| NVIDIA GeForce RTX 4090 | 24 GB | 1008 GB/s | 450 W | Consumer |
| AMD Radeon RX 7900 XTX | 24 GB | 960 GB/s | 355 W | Consumer |
| NVIDIA GeForce RTX 3090 | 24 GB | 936 GB/s | 350 W | gebraucht |
| NVIDIA Tesla P40 | 24 GB | 347 GB/s | 250 W | gebraucht |
| NVIDIA Tesla M40 24GB | 24 GB | 288 GB/s | 250 W | gebraucht |
| AMD Radeon RX 7900 XT | 20 GB | 800 GB/s | 315 W | Consumer |
| NVIDIA GeForce RTX 5080 | 16 GB | 960 GB/s | 360 W | Consumer |
| NVIDIA GeForce RTX 4080 Super | 16 GB | 736 GB/s | 320 W | Consumer |
| NVIDIA GeForce RTX 4070 Ti Super | 16 GB | 672 GB/s | 285 W | Consumer |
| Intel Arc A770 16GB | 16 GB | 560 GB/s | 225 W | Consumer |
| NVIDIA GeForce RTX 3060 12GB | 12 GB | 360 GB/s | 170 W | Consumer |
Preise werden manuell gepflegt — aktuell unvollständig, daher ausgeblendet. Auf den Detailseiten siehst du Affiliate-Links zu den jeweiligen Shops.
