KI-Rundschau

Qwen 2.5 7B

Alibaba · 7 Mrd. Parameter · Apache-2.0

Kleinerer Qwen für Mid-Range-Hardware. Apache-2.0. Erstaunliche Qualität in 7B-Klasse.

Lizenz: Apache-2.0. Apache 2.0 ist eine der permissivsten Open-Source-Lizenzen — kommerzielle Nutzung, Modifikation und Weiterverbreitung uneingeschränkt erlaubt, inklusive Patent-Klausel. Das macht Qwen 2.5 7B besonders interessant für On-Prem-Deployments in Unternehmen, kommerzielle SaaS-Produkte und Embedded-Lösungen.

Qwen 2.5 7B hat 7 Mrd. Parameter und braucht in Q4_K_M-Quantisierung rund 6-7 GB VRAM. Damit läuft das Modell auf praktisch jeder modernen GPU ab RTX 3060 12GB aufwärts. Apple-Silicon-Geräte mit 16+ GB Unified Memory sind ebenfalls bestens geeignet.

Mit 128k Tokens Kontext (~96k Wörter) eignet sich Qwen 2.5 7B für lange Texte, Multi-Dokument-RAG und umfangreiche System-Prompts ohne Chunking-Overhead.

Deutsch-Qualität: gut. Solide deutsche Ausgabe für die meisten produktiven Use-Cases — gelegentlich englische Phrasen oder leichte Holprigkeiten, aber überzeugend.

Parameter
7 B
Lizenz
Apache-2.0
Wirklich offen?
✓ ja
Deutsch-Qualität
gut
Kontextfenster
128k Tokens
Vendor
Alibaba
Release
18.9.2024
Familie
Qwen
Auf Hugging Face öffnen

Qwen 2.5 7B lokal: Welche GPU brauche ich?

22 GPUs können Qwen 2.5 7B in mindestens einer praktikablen Quantisierung fahren — sortiert nach VRAM-Kapazität. Tokens/Sek-Werte werden manuell aus Community-Benchmarks gepflegt (siehe Confidence-Badges auf den Detailseiten).

GPUBeste QuantVRAM-Bedarf
Apple Mac Studio M3 Ultra 192GBQ8_08.2 GB
Apple MacBook Pro M4 Max 128GBQ8_08.2 GB
Apple Mac Studio M3 Ultra 96GBQ8_08.2 GB
NVIDIA H100 80GBQ8_08.2 GB
Apple Mac mini M4 Pro 64GBQ8_08.2 GB
Apple MacBook Pro M4 Max 64GBQ8_08.2 GB
NVIDIA L40SQ8_08.2 GB
NVIDIA RTX 6000 Ada GenerationQ8_08.2 GB
NVIDIA RTX A6000Q8_08.2 GB
NVIDIA GeForce RTX 5090Q8_08.2 GB
AMD Radeon RX 7900 XTXQ8_08.2 GB
NVIDIA GeForce RTX 3090 TiQ8_08.2 GB
NVIDIA GeForce RTX 3090Q8_08.2 GB
NVIDIA GeForce RTX 4090Q8_08.2 GB
NVIDIA Tesla M40 24GBQ8_08.2 GB
NVIDIA Tesla P40Q8_08.2 GB
AMD Radeon RX 7900 XTQ8_08.2 GB
Intel Arc A770 16GBQ8_08.2 GB
NVIDIA GeForce RTX 4070 Ti SuperQ8_08.2 GB
NVIDIA GeForce RTX 4080 SuperQ8_08.2 GB
NVIDIA GeForce RTX 5080Q8_08.2 GB
NVIDIA GeForce RTX 3060 12GBQ8_08.2 GB