DeepSeek

Lokale KI & Self-Hosting

DeepSeek — Chinesisches Modell mit starkem Code/Reasoning-Fokus.

Beispiel

DeepSeek hat 2025 mit niedrigen Trainingskosten für Aufsehen gesorgt — gute lokale Wahl für Code-Tasks.

Verwandt: Qwen · Llama

Mehr im Glossar

Alle Begriffe auf einen Blick →

DeepSeek ist ein chinesisches KI-Unternehmen, das große Sprachmodelle entwickelt und diese als Open-Source-Software sowie über eine kostenpflichtige API anbietet.

In einfachen Worten

Stellen Sie sich DeepSeek wie einen freien Werkzeugkasten für künstliche Intelligenz vor. Während andere Firmen wie OpenAI oder Google ihre leistungsstärksten KI-Modelle hinter Bezahlschranken verstecken, legt DeepSeek die Baupläne offen. Jeder kann die Modelle herunterladen, auf dem eigenen Server installieren und anpassen. Das ist so, als ob ein Autohersteller nicht nur das fertige Auto verkauft, sondern auch die Konstruktionszeichnungen und die Fertigungsstraße veröffentlicht. DeepSeek hat mit seinem Modell R1 im Januar 2025 für Aufsehen gesorgt, weil es mit einem Bruchteil der Kosten von Konkurrenzmodellen ähnliche Leistungen erzielt – die Trainingskosten lagen bei etwa 5,6 Millionen US-Dollar, während vergleichbare Modelle hundert Millionen oder mehr kosten.

Was bedeutet das technisch

DeepSeek entwickelt große Sprachmodelle (Large Language Models, LLMs) auf Basis der Transformer-Architektur. Das bekannteste Modell ist DeepSeek-R1, ein sogenanntes Reasoning-Modell. Anders als einfachere Sprachmodelle, die nur Text vorhersagen, durchläuft R1 einen mehrstufigen Denkprozess. Es zerlegt komplexe Fragen in Zwischenschritte, überprüft diese auf logische Konsistenz und korrigiert sich bei Bedarf selbst. Das nennt man Chain-of-Thought-Reasoning.

Technisch bemerkenswert ist die Effizienz: DeepSeek nutzt eine spezielle Form der Modellarchitektur namens Mixture of Experts (MoE). Dabei aktiviert das Modell für jede Anfrage nur einen Teil seiner insgesamt 671 Milliarden Parameter – konkret etwa 37 Milliarden. Das senkt den Rechenaufwand drastisch. Zudem setzt DeepSeek auf Multi-Token-Prediction: Statt wie üblich nur das nächste Wort vorherzusagen, sagt das Modell mehrere Wörter auf einmal voraus. Das beschleunigt die Textgenerierung und verbessert die Kohärenz.

Die Modelle sind als Open Source unter der MIT-Lizenz veröffentlicht. Das bedeutet: Jeder darf sie herunterladen, verändern und kommerziell nutzen. DeepSeek bietet aber auch eine kostenpflichtige API an, die etwa 90 Prozent günstiger ist als vergleichbare Angebote von OpenAI. Ein wichtiger Unterschied zu westlichen Modellen: DeepSeek unterliegt chinesischen Zensurvorschriften. Das Modell verweigert Antworten zu sensiblen politischen Themen wie der Kommunistischen Partei Chinas, Taiwan oder der Tiananmen-Proteste.

Warum es für KMU relevant ist

Für kleine und mittlere Unternehmen bietet DeepSeek vor allem zwei Vorteile: Kosten und Kontrolle. Die API-Kosten liegen bei etwa 0,14 Euro pro Million Token für Eingaben und 0,55 Euro für Ausgaben. Das ist ein Bruchteil dessen, was GPT-4 oder Claude kosten. Wenn Ihr Unternehmen täglich tausende Kundentexte analysiert oder automatisiert beantwortet, sparen Sie schnell mehrere tausend Euro im Monat.

Der zweite Vorteil ist die Open-Source-Natur. Sie können DeepSeek auf Ihren eigenen Servern installieren. Das ist entscheidend, wenn Sie mit sensiblen Kundendaten arbeiten – etwa im Gesundheitswesen, in der Rechtsberatung oder im Finanzsektor. Keine Daten verlassen Ihr Netzwerk. Sie müssen sich keine Sorgen machen, dass Ihre Geschäftsgeheimnisse über eine US-amerikanische oder chinesische Cloud laufen. Allerdings: Die Installation und Wartung eines 671-Milliarden-Parameter-Modells erfordert erhebliche Rechenleistung. Für die meisten KMU ist die API die praktikablere Lösung.

Praktische Anwendungsfälle: Automatisierte E-Mail-Klassifizierung und -Beantwortung, Erstellung von Produktbeschreibungen, Analyse von Kundenfeedback, Übersetzung von Dokumenten, Erstellung von Zusammenfassungen langer Berichte. DeepSeek-R1 eignet sich besonders gut für Aufgaben, die logisches Denken erfordern – etwa die Analyse von Vertragsklauseln oder die Fehlersuche in technischen Dokumentationen.

Ein Risiko sollten Sie nicht ignorieren: DeepSeek unterliegt chinesischem Recht. Bei politisch sensiblen Themen erhalten Sie verweigerte oder zensierte Antworten. Für die meisten geschäftlichen Anwendungen ist das irrelevant. Wenn Ihr Unternehmen aber in Bereichen wie Menschenrechten, politischer Beratung oder internationalen Beziehungen tätig ist, sollten Sie Alternativen prüfen.

Verwandte Begriffe

KI-Modelle – Grundlage für DeepSeeks Funktionsweise

Open-Source-KI – Lizenzmodell, das DeepSeek verwendet

Reasoning – Denkprozess, den DeepSeek-R1 besonders gut beherrscht

API – Schnittstelle zur Nutzung von DeepSeek ohne eigene Server

Parameter – Maß für die Größe und Leistungsfähigkeit von KI-Modellen