Apps & Mobile Entwicklung
AMDs Next Big Thing: „Helios“ mit MI400 und Venice soll es mit Nvidia Vera Rubin aufnehmen
Mit Spannung wurde AMDs offizielle Enthüllung einer neue Rackscale-Lösung erwartet. „Helios“ mit MI400 und 6th Gen Epyc, Codename Venice, heißt die Lösung offiziell. Auf dem Papier kann das System dabei gegen eine Vera-Rubin-Lösung von Nvidia bestehen oder diese sogar übertreffen, das Papier stammt natürlich von AMD.
Bei Instinct MI350X und Instinct MI355X und deren Rack-Lösungen steckt AMD in der Zwickmühle. Einerseits preist AMD deren Standard-Designs an, die überall Anschluss finden können, gibt aber auch zu, dass sie tendenziell für „Legacy-Datacenter“ geeignet sind.
AMD folgt Nvidia im Datacenter
Und so blicken sie bei AMD wohl mit mehr als einem Auge schon auf das, was nächstes Jahr kommen wird. Denn dann geht AMD Nvidias Weg und liefert eine eigene vollständige Rack-Lösung mit aktuell mindestens 72 GPUs, also einen direkten Gegenspieler zu Nvidia NVL72 respektive NVL144, wie sie laut neuer Zählweise heißen.
Diese Systeme, vollständig mit GPU und CPU (Grace Blackwell Superchip), Speicher, Kühlung, Stromversorgung und Netzwerk (Mellanox) ausgestattet, liefert Nvidia zu Tausenden pro Woche aus und druckt damit sprichwörtlich Geld, die Großkunden stehen Schlange. Von diesem Kuchen will AMD ein größeres Stück, fünf Prozent, die Instinct bisher vom Markt geholt hat, haben viel Potenzial nach oben.
Das neue AI-Rack ist nicht nur für Scale-up (Erweiterung im Rack) sonder auch Scale-out (Erweiterung mit Racks) gedacht. Es setzt auf Epyc-Prozessoren, Instinct-Beschleuniger, AMDs Ultra-Ethernet-Karten und natürlich AMD-Software. Es wird dabei jedoch gewisse OCP-Standards einhalten, unklar bleibt jedoch, ob in allen Bereichen. Herzstück ist MI400, der primär als DLC-Version mit Flüssigkeitskühlung erscheinen wird, aber für klassische Systeme sei auch eine luftgekühlte Variante nach wie vor im Programm, bestätigte AMD.
MI400 klotzt mit Speicher und FP4-Leistung
Die Entwicklung von MI400 ist bereits weit voran geschritten, erklärt AMD, Partner nennen es schon den game changer. Die FP4-Leistung beim MI450X wird gegenüber MI355X noch einmal verdoppelt, die Speicherbandbreite massiv steigen, unter anderem weil nun 432 GByte HBM4 verbaut werden. Das wiederum dürfte zwölf HBM4-Stacks entsprechen, die jeweils 36 GByte fassen, also HBM4 12Hi, das geplanten Standard-Design – das „zufällig“ heute auch von Micron als Muster vorgestellt wurde. Es ergeben sich überragende 19,8 TByte/s Speicherbandbreite.
Eine TDP-Boardpower nennt AMD heute auch auf Nachfrage nicht, sie dürfte aber oberhalb der 1.400 Watt von MI355X liegen. Am Dienstag hatte AMDs CTO bereits eine Roadmap im Programm, die ein Indiz liefern könnte: Für MI450X sind 1.600 Watt alles andere als unrealistisch.
Die bis zu zehnfache Leistung verspricht AMD, MI400 werde der schnellste AI-Beschleuniger im Jahr 2026, ergänzt das Unternehmen. Vorgängergenerationen sollen aber nicht direkt auslaufen. MI300 werden beispielsweise noch das ganze Jahr 2025 ausgeliefert, selbst wenn MI350 im zweiten Halbjahr breit verfügbar wird. Gleiches soll auch 2026 gelten, MI350 wird dann weiter im Portfolio unterhalb MI400 stehen.
Venice mit PCIe 6.0 und 256 2-nm-Kernen
Die neuen GPUs brauchen auch passende Prozessoren. Venice als neue Epyc-Generation mit bis zu 256 Zen-6-Kernen aus TSMCs N2-Fertigung soll hier deutlich mehr Leistung bereitstellen, als bisher. Die Bandbreite zur GPU soll verdoppelt werden, die Footnotes bestätigte: 128 PCIe-6.0-Lanes wird Venice in einem Dual-Sockel-Einsatz bieten. Wie AMD auf die 1,7-fache Leistung kommt, bleibt unklar. 256 Kerne sind natürlich bereits mehr als die 192 kleineren Zen-5c- oder gar nur 128 klassischen Zen-5-Kerne der aktuellen Generation, schnell lässt sich dort vermutlich ein Einsatzzweck finden, wo diese Rechnung funktioniert. Das gilt auch für die Speicherbandbreite, aktuell sind pro Sockel 614 GB/s möglich, ein breiteres Interface und schnellerer RAM sorgen im Dual-Sockel-Betrieb hier flott für größere Zahlen. Die ersten Samples arbeiten fantastisch, erklärte Lisa Su auf der Bühne.
Die 2026 kommenden Vulcano-DPUs sind ebenfalls ein wichtiger Punkt für das neue Rack. Der Nachfolger der aktuellen Ethernet-Lösung wird vollständig den UAL-Standards entsprechen. Dahinter steht ein riesiges Konsortium, es verspricht ein Einsatzgebiet, welches viel breiter ist als das, welches Nvidias NVLink unterstützt.
Auf die Frage, ob man in Zukunft denn auch die passenden Switches bauen würde, erteilte AMD keine Absage. Zuerst wolle man dies aber Partnern überlassen, der offene Standard erlaube das schließlich auch.
MI400 vs. Vera Rubin im Rack
Bei gleicher Anzahl an GPUs, 72 an der Zahl, sieht sich AMD mit MI400 in der Rechenleistung in etwa auf Augenhöhe zu Nvidia, erschlägt den Konkurrenten dann aber beim Speicher und auch der zur Verfügung stehende Bandbreite für benachbarte Systeme. 50 Prozent mehr HBM, 50 Prozent mehr Speicherbandbreite und 50 Prozent mehr Bandbreite nach nebenan (Scale-out) soll das AMD-Helios-Rack gegenüber der Oberon-Ausführung mit Vera Rubin liefern.
Das klingt alles ziemlich vielversprechend, aber Nvidia schläft nicht und liegt bei der Umsetzung von Partnerprojekten derzeit meilenweit voraus. So gibt es schon Vera-Rubin-Projektankündigungen wie Blue Lion am LRZ, bei AMD Helios hingegen noch nicht.
ComputerBase wurde von AMD zum Event Advancing AI 2025 nach San Jose in die USA eingeladen, hat die Einladung aus Termingründen aber ausgeschlagen. Die Redaktion erhielt dennoch alle Präsentationen und Informationen unter NDA vorab. Die einzige Vorgabe war der frühestmögliche Veröffentlichungstermin.