Apps & Mobile Entwicklung

(G)B300 vs. (G)B200: Blackwell Ultra nimmt Steroide und beherrscht PCIe 6.0


Als Nvidia GB300 auf Basis von Blackwell Ultra zur GTC im März 2025 präsentierte, blieben viele technische Fragen zum Blackwell-Refresh als Brückenschlag zum echten Nachfolger Nvidia Rubin mit Vera noch offen. Zur Konferenz Hot Chips 2025 hat der Konzern jetzt einige geklärt – Überraschung inklusive.

Blackwell Ultra übernimmt wohl den Blackwell-Dual-Die

Eine wesentliche Frage betraf die nach der zugrundeliegenden GPU. Nutzt Blackwell Ultra eine neue, oder die 208 Milliarden schwere Blackwell-GPU mit zwei in einem Chip verbundenen Dies? Dass es die gleiche GPU sein wird, lag nahe, doch erst Nvidias Developer Blog stellt jetzt fest: „Blackwell Ultra is manufactured using TSMC 4NP and features 208B transistors.

Identische Anzahl Transistoren, identischer Fertigungsprozess – Blackwell Ultra sollte damit auf Chip-Ebene 1:1 Blackwell entsprechen (auch wenn das Blackwell White Paper (PDF) die 208 Mrd. Transistoren explizit nur in Bezug auf Blackwell nennt). Die teils doch gravierenden Unterschiede zwischen Blackwell und Blackwell Ultra erscheinen vor diesem Hintergrund in einem ganz anderen Licht.

Blackwell Ultra bietet mehr

Denn rückblickend war Blackwell als B100, B200 oder GB200 damit sehr stark beschnitten. GB300 nutzt in Zukunft 160 Streaming Multiprocessors mit je 128 Cuda-Kernen, B100, B200 und GB200 griffen hingegen nur auf 144 zurück. Der Vollausbau des Chips dürfte sogar noch mehr Einheiten bieten.

Ein Blick auf die Dual-Die-Blackwell(-Ultra)-GPU (Bild: Nvidia)

Der breitere Chip darf darüber hinaus noch etwas mehr elektrische Leistung aufnehmen: 1.400 statt 1.200 Watt sind es für das Dual-GPU-CPU-Konstrukt „Grace Blackwell“ (GB300 vs. GB200), 1.200 statt 1.000 Watt für eine separate GPU (B300 vs. B200). Statt 186 GB HBM3e sind 288 GB HBM3e angebunden – dabei bleibt es bei acht Stapeln („Stacks“).

50 Prozent mehr FP4-Leistung

Mehr Ausführungseinheiten, mehr TDP, dadurch mehr Takt und mehr HBM3e – klar, dass Blackwell Ultra schneller ist als Blackwell. Doch schon im März ließ aufhorchen, dass die neue Version bis zu 50 Prozent schneller sein soll. Das Unternehmen sprach von 15 PetaFLOPS für FP4 Dense, also ohne die Sparsity-Beschleunigung, mit der 30 PetaFLOPS möglich sind. Für die ursprüngliche Blackwell-GPU lag diese Angabe noch bei 10 PetaFLOPS. Im Juni dieses Jahres führte Nvidia das weiter aus.

Die überproportional höhere FP4-Leistung von Blackwell Ultra kommt allerdings mit einem Haken: Die INT8, aber insbesondere die FP64-Leistung fällt deutlich. Insbesondere FP64 ist für das Hauptanwendungsgebiet der GPUs, AI Training und Inferencing allerdings so gut wie irrelevant, während FP4 für AI-Anwendungen von immer größerer Bedeutung ist.

Blackwell Ultra legt am stärksten bei FP4 zu (Bild: Nvidia)

Sofern der Chip wirklich der gleiche geblieben ist, hat Nvidia diese Anpassungen allein per „Firmware“ vorgenommen.

PCI Express 6.0

Eine weitere Anpassung von Blackwell Ultra gegenüber Blackwell müsste das ebenso betreffen: Das PCI-Express-Interface beherrscht jetzt PCIe 6.0 mit bis zu 256 GB/s statt vormals PCIe 5.0 mit bis zu 128 GB/s. Die Hardware dafür muss der Blackwell-Chip also ebenfalls schon geboten haben, nur freigegeben wurde die im Jahr 2022 verabschiedete PCIe-Version 6.0 erst jetzt.



Source link

Beliebt

Die mobile Version verlassen