Was ist eine TPU genau?

Eine TPU ist ein anwendungsspezifischer integrierter Schaltkreis (ASIC), der von Google entwickelt wurde, um maschinelles Lernen zu beschleunigen. Sie ist optimiert für TensorFlow und wird hauptsächlich in Googles Cloud-Infrastruktur eingesetzt.

Wo liegen die Vorteile einer TPU gegenüber einer GPU?

TPUs bieten eine höhere Energieeffizienz und spezifische Optimierungen für Matrixoperationen, die in neuronalen Netzen häufig vorkommen. Für große Cloud-basierte KI-Workloads können sie daher kostengünstiger und schneller sein als GPUs.

Für welche KI-Aufgaben sind TPUs besonders geeignet?

TPUs eignen sich besonders für das Training und die Inferenz großer neuronaler Netze, wie sie in der Bilderkennung, Sprachverarbeitung und bei Empfehlungssystemen vorkommen. Sie werden von Google selbst für Dienste wie Google Fotos und die Sprachsuche genutzt.

Glossar

TPU

Q: Kann ich eine TPU lokal nutzen?

Nein, TPUs sind nicht für den lokalen Einsatz vorgesehen. Sie sind nur über Google Cloud verfügbar, entweder als Cloud TPU oder über den Edge TPU für IoT-Geräte. Für lokale KI-Anwendungen sind GPUs oder spezielle KI-Beschleuniger wie Intels Nervana oder Nvidias Jetson-Plattform besser geeignet.

Auf einen Blick

TPU (Tensor Processing Unit) ist ein von Google entwickelter ASIC-Chip, der speziell für maschinelles Lernen optimiert ist. Er wird hauptsächlich in der Google Cloud eingesetzt und ist für lokale Anwendungen kaum relevant.

Kategorie	Hardware
Lesezeit	5 Min
Zielgruppe	KI-Entwickler, Cloud-Architekten
Schwierigkeit	Fortgeschritten
Stand	2026-05
Quellen	Herstellerdokumentation

Hardware

TPU — Googles KI-Spezial-Chip — relevant für Cloud, kaum für lokal.

Beispiel

TPUs nutzt vor allem Google Cloud — als Endkunde-Hardware spielt das keine Rolle.

Verwandt: GPU · Cloud-GPU

Mehr im Glossar

Alle Begriffe auf einen Blick →

Eine TPU (Tensor Processing Unit) ist ein speziell für maschinelles Lernen entwickelter Prozessor, der Matrixberechnungen für KI-Modelle massiv beschleunigt.

In einfachen Worten

Stellen Sie sich einen normalen Computerprozessor (CPU) wie einen Allround-Handwerker vor: Er kann Tische bauen, Wände streichen und Leitungen verlegen – aber alles nacheinander und nicht besonders schnell. Eine Grafikkarte (GPU) ist wie ein Team von 100 Malern, die parallel eine Wand streichen. Eine TPU ist wie eine Fabrik, die nur einen einzigen Handgriff beherrscht: das gleichzeitige Multiplizieren und Addieren von Tausenden Zahlen. Diese eine Aufgabe erledigt sie aber tausendmal schneller als jeder Allrounder. Für KI-Modelle, die im Kern aus genau diesen Multiplikationen bestehen, ist die TPU daher die ideale Maschine.

Was bedeutet das technisch

TPUs sind anwendungsspezifische integrierte Schaltungen (ASICs), die Google ab 2016 für sein hauseigenes KI-Framework TensorFlow entwickelte. Im Kern bestehen sie aus einer sogenannten Systolic-Array-Architektur: einer matrixförmigen Anordnung von tausenden Recheneinheiten, die Daten wie in einer Pipeline von Zelle zu Zelle weiterreichen. Jede Zelle führt eine Multiplikation durch und addiert das Ergebnis zum Wert der Nachbarzelle. Das ermöglicht die hochparallele Berechnung von Matrix-Multiplikationen, der fundamentalen Operation neuronaler Netze.

Eine einzelne TPU der vierten Generation (TPU v4) erreicht eine Rechenleistung von über 275 Teraflops (Billionen Gleitkommaoperationen pro Sekunde) bei 16-Bit-Genauigkeit. Zum Vergleich: Eine High-End-CPU schafft etwa 1-2 Teraflops, eine leistungsstarke GPU etwa 30-80 Teraflops. TPUs verfügen außerdem über einen großen, schnellen On-Chip-Speicher (HBM2e, bis zu 32 GB pro Chip) und ein eigenes Hochgeschwindigkeits-Netzwerk (ICI), das den Verbund von bis zu 4096 TPUs zu einem Supercomputer erlaubt. Anders als CPUs oder GPUs können TPUs jedoch nur KI-Workloads ausführen – für normale Bürosoftware oder Datenbankabfragen sind sie ungeeignet.

Warum es für KMU relevant ist

Für die meisten KMU sind TPUs nicht direkt relevant, da sie ausschließlich in den Rechenzentren von Google Cloud verfügbar sind. Sie kaufen keine TPU-Hardware, sondern mieten Rechenzeit in der Cloud. Der entscheidende Vorteil: Für das Training großer KI-Modelle (z.B. Sprachmodelle mit Milliarden Parametern oder Bilderkennungssysteme) sind TPUs oft die günstigste und schnellste Option. Google gibt an, dass TPU v4 im Vergleich zu vergleichbaren GPU-Clustern bis zu 50% weniger Kosten verursacht und 30% weniger Energie verbraucht.

Ein konkretes Beispiel: Ein KMU, das ein eigenes KI-Modell zur Qualitätskontrolle in der Fertigung trainieren möchte, könnte dafür TPUs in der Google Cloud nutzen. Statt für 50.000 Euro eine eigene GPU-Workstation zu kaufen, mietet das Unternehmen für einige Stunden TPU-Rechenzeit für wenige hundert Euro. Der Nachteil: Sie binden sich an die Google-Cloud-Infrastruktur. Für kleinere Modelle oder den Betrieb (Inferenz) im laufenden Betrieb sind GPUs meist die praktikablere Wahl, da sie flexibler und breiter verfügbar sind. Auch der Umstieg von TensorFlow auf andere Frameworks wie PyTorch kann auf TPUs aufwändiger sein. Für KMU gilt: TPUs sind eine Option, wenn Sie große Modelle trainieren müssen und bereits in der Google Cloud arbeiten. Für den Einstieg in KI reichen meist GPUs völlig aus.

Häufige Fragen

Was ist eine TPU?

Eine TPU (Tensor Processing Unit) ist ein von Google entwickelter anwendungsspezifischer Chip (ASIC), der für die Beschleunigung von TensorFlow-Berechnungen optimiert ist. Er wird in Googles Rechenzentren eingesetzt, um KI-Modelle effizient zu trainieren und auszuführen.

Wie unterscheidet sich eine TPU von einer GPU?

TPUs sind speziell für Matrixoperationen in neuronalen Netzen optimiert, während GPUs allgemeiner für parallele Berechnungen ausgelegt sind. TPUs bieten oft eine höhere Effizienz pro Watt bei KI-Workloads, sind aber weniger flexibel.

Kann ich eine TPU lokal nutzen?

Nein, TPUs sind nicht als Endverbraucherprodukt erhältlich. Sie werden ausschließlich in der Google Cloud oder in Googles eigener Infrastruktur angeboten. Für lokale KI-Berechnungen sind GPUs oder NPUs (Neural Processing Units) besser geeignet.

Welche TPU-Generationen gibt es?

Google hat mehrere TPU-Generationen veröffentlicht: TPU v1 für Inferenz, TPU v2 und v3 für Training und Inferenz, sowie TPU v4 und v5p mit verbesserter Leistung und Skalierbarkeit. Jede Generation bietet höhere Rechenleistung und Speicherbandbreite.

Zuletzt aktualisiert: 2026-06-01 · Autor: Florian Neuhuber

TPU

Beispiel

In einfachen Worten

Was bedeutet das technisch

Warum es für KMU relevant ist

Verwandte Begriffe

Häufige Fragen

Was ist eine TPU?

Wie unterscheidet sich eine TPU von einer GPU?

Kann ich eine TPU lokal nutzen?

Welche TPU-Generationen gibt es?

Lies auch

SPF (Sender Policy Framework)

SMTP (Simple Mail Transfer Protocol)

DKIM (DomainKeys Identified Mail)

Kommentare ()

Beispiel

In einfachen Worten

Was bedeutet das technisch

Warum es für KMU relevant ist

Verwandte Begriffe

Häufige Fragen

Was ist eine TPU?

Wie unterscheidet sich eine TPU von einer GPU?

Kann ich eine TPU lokal nutzen?

Welche TPU-Generationen gibt es?

Lies auch

Kommentare ( )

Kommentare ()