TPU

Hardware

TPU — Googles KI-Spezial-Chip — relevant für Cloud, kaum für lokal.

Beispiel

TPUs nutzt vor allem Google Cloud — als Endkunde-Hardware spielt das keine Rolle.

Verwandt: GPU · Cloud-GPU

Mehr im Glossar

Alle Begriffe auf einen Blick →

Eine TPU (Tensor Processing Unit) ist ein speziell für maschinelles Lernen entwickelter Prozessor, der Matrixberechnungen für KI-Modelle massiv beschleunigt.

In einfachen Worten

Stellen Sie sich einen normalen Computerprozessor (CPU) wie einen Allround-Handwerker vor: Er kann Tische bauen, Wände streichen und Leitungen verlegen – aber alles nacheinander und nicht besonders schnell. Eine Grafikkarte (GPU) ist wie ein Team von 100 Malern, die parallel eine Wand streichen. Eine TPU ist wie eine Fabrik, die nur einen einzigen Handgriff beherrscht: das gleichzeitige Multiplizieren und Addieren von Tausenden Zahlen. Diese eine Aufgabe erledigt sie aber tausendmal schneller als jeder Allrounder. Für KI-Modelle, die im Kern aus genau diesen Multiplikationen bestehen, ist die TPU daher die ideale Maschine.

Was bedeutet das technisch

TPUs sind anwendungsspezifische integrierte Schaltungen (ASICs), die Google ab 2016 für sein hauseigenes KI-Framework TensorFlow entwickelte. Im Kern bestehen sie aus einer sogenannten Systolic-Array-Architektur: einer matrixförmigen Anordnung von tausenden Recheneinheiten, die Daten wie in einer Pipeline von Zelle zu Zelle weiterreichen. Jede Zelle führt eine Multiplikation durch und addiert das Ergebnis zum Wert der Nachbarzelle. Das ermöglicht die hochparallele Berechnung von Matrix-Multiplikationen, der fundamentalen Operation neuronaler Netze.

Eine einzelne TPU der vierten Generation (TPU v4) erreicht eine Rechenleistung von über 275 Teraflops (Billionen Gleitkommaoperationen pro Sekunde) bei 16-Bit-Genauigkeit. Zum Vergleich: Eine High-End-CPU schafft etwa 1-2 Teraflops, eine leistungsstarke GPU etwa 30-80 Teraflops. TPUs verfügen außerdem über einen großen, schnellen On-Chip-Speicher (HBM2e, bis zu 32 GB pro Chip) und ein eigenes Hochgeschwindigkeits-Netzwerk (ICI), das den Verbund von bis zu 4096 TPUs zu einem Supercomputer erlaubt. Anders als CPUs oder GPUs können TPUs jedoch nur KI-Workloads ausführen – für normale Bürosoftware oder Datenbankabfragen sind sie ungeeignet.

Warum es für KMU relevant ist

Für die meisten KMU sind TPUs nicht direkt relevant, da sie ausschließlich in den Rechenzentren von Google Cloud verfügbar sind. Sie kaufen keine TPU-Hardware, sondern mieten Rechenzeit in der Cloud. Der entscheidende Vorteil: Für das Training großer KI-Modelle (z.B. Sprachmodelle mit Milliarden Parametern oder Bilderkennungssysteme) sind TPUs oft die günstigste und schnellste Option. Google gibt an, dass TPU v4 im Vergleich zu vergleichbaren GPU-Clustern bis zu 50% weniger Kosten verursacht und 30% weniger Energie verbraucht.

Ein konkretes Beispiel: Ein KMU, das ein eigenes KI-Modell zur Qualitätskontrolle in der Fertigung trainieren möchte, könnte dafür TPUs in der Google Cloud nutzen. Statt für 50.000 Euro eine eigene GPU-Workstation zu kaufen, mietet das Unternehmen für einige Stunden TPU-Rechenzeit für wenige hundert Euro. Der Nachteil: Sie binden sich an die Google-Cloud-Infrastruktur. Für kleinere Modelle oder den Betrieb (Inferenz) im laufenden Betrieb sind GPUs meist die praktikablere Wahl, da sie flexibler und breiter verfügbar sind. Auch der Umstieg von TensorFlow auf andere Frameworks wie PyTorch kann auf TPUs aufwändiger sein. Für KMU gilt: TPUs sind eine Option, wenn Sie große Modelle trainieren müssen und bereits in der Google Cloud arbeiten. Für den Einstieg in KI reichen meist GPUs völlig aus.

Verwandte Begriffe

GPU – Der direkte Konkurrent für KI-Beschleunigung, breiter verfügbar und flexibler einsetzbar.

CPU – Der Allzweckprozessor, der für die meisten KMU-Anwendungen die Basis bildet.

TensorFlow – Das KI-Framework von Google, für das TPUs ursprünglich entwickelt wurden.

Neuronales Netz – Die grundlegende Architektur, die TPUs durch ihre Matrixoperationen beschleunigen.

Cloud Computing – Die Bereitstellungsform, über die KMU auf TPUs zugreifen können.