Welche GPU für Gemini 2.0 Flash lokal?
Gemini 2.0 Flash hat 200 Mrd. Parameter. Diese GPUs können das Modell in mindestens einer praktikablen Quantisierung fahren — sortiert nach Preis pro GB VRAM.
| GPU | beste Quant | VRAM-Bedarf | Tokens/Sek | Preis | €/GB |
|---|
Gemini 2.0 Flash hat 200 Mrd. Parameter. Diese GPUs können das Modell in mindestens einer praktikablen Quantisierung fahren — sortiert nach Preis pro GB VRAM.
| GPU | beste Quant | VRAM-Bedarf | Tokens/Sek | Preis | €/GB |
|---|