Apps & Mobile Entwicklung
Nvidia zum OCP: Vera Rubin NVL144 MGX als (halb-)offene Partnerplattform
Zum OCP Global Summit bringt Nvidia die aktualisierte MGX-Plattform mit, die künftig auf Vera-Rubin-Trays und bald auch Kyber-Racks setzt. MGX bedeutet, dass diese Lösungen zumindest etwas offen gestaltet sind, was Partnern ermöglicht, eigene Lösungen für Trays, Blades und mehr zu entwickeln, die so auch flotter im Markt sind.
Open Compute für mehr Flexibilität (und Umsatz)
Technische Daten mit dem Open Compute Project (OCP) zu teilen macht Nvidia nicht uneigennützig. Die Modularität der komplexen Systeme soll sich nämlich bei Vera Rubin noch weiter erhöhen, wodurch sich Nvidia im Endeffekt aber eine kürzere Zeit bis zur Verfügbarkeit im Markt verspricht.
Bei der Vorgängergeneration war Nvidia noch nicht so offen, erst im vergangenen Oktober hat das Unternehmen die Details für die aktuelle GB200-Blackwell-Generation geteilt, der Startschuss für GB200 war da aber längst erfolgt. Nun jedoch ist der Zeitplan ein ganz anderer, bis die ersten Vera-Rubin-Systeme kommen, wird wohl mindestens noch ein Jahr vergehen. Immerhin ist die Basis von GB200, GB300 und auch Vera Rubin (VR200) aber sehr ähnlich, schließlich sitzen alle im sogenannten Oberon-Rack.
Das Standard-Rack von Nvidia wird im kommenden Jahr Vera Rubin NVL144. Die daraus resultierende MGX-Version unterstützen direkt über 50 Partner zum Start. Die dann (halb-)offenen Standards nach OCP sind durch Firmen zumindest teilweise gemeinsam festgelegt worden oder werden, wie in dem Fall, von Nvidia zur Verfügung gestellt. Sie betreffen die Bereiche Formfaktoren, Komponenten, Leistungsaufnahme, Kühlung und mehr. Beteiligte Partner können entsprechende Bauteile direkt auf die Blaupausen hin ausrichten und entwickeln, die sich dann wiederum in den passenden Trays, Blades und Racks verbauen lassen.
Auch der Verbreitung von Nvidias NVLink soll dies am Ende alles helfen. Kürzlich hatte sich Nvidia hier bekanntlich auch bei Intel eingekauft, von dort kommen in Zukunft passende x86-Prozessoren direkt mit NVLink-Schnittstelle. Aber auch Samsung ist neben MediaTek und weiteren Partner bei NVLink Fusion nun mit an Board, exakte Produkte werden aber von noch keinem Unternehmen benannt. Die erste Kooperation zwischen Nvidia und MediaTek mit NVLink beim GB10/N1, welcher MediaTeks Arm-Kerne mit Nvidias GeForce kombiniert, ist von diversen Problemen und Verzögerungen geplagt.
Das Kyber-Rack mit 800-VDC kommt
Das zunehmende Engagement in dem Bereich ist auch dazu gedacht, um die Partner bereits auf die nächste Revolution einzustimmen. Das Kyber-Rack ist die Plattform für Rubin Ultra ab 2027, 576 GPUs werden dann in einem hochdensen Rack verbaut sein.
Die offensichtlichste Neuerung bei Kyber ist die Anordnung der Blades: sie sind um 90 Grad gedreht und stehen nun eher wie Bücher in einem Regal. Die dazu noch kompaktere Bauweise stellt Anforderungen an das gesamte Ökosystem, vor allem an die Kühlung und Energiezufuhr.
Beim Thema Energiezufuhr hat Nvidia im Frühjahr bereits die 800-VDC-Architektur ins Leben gerufen. Mit Industriepartnern wird gemeinsam ein effizienteres Design angestrebt, welches Umwandlungsverluste eindämmen soll und darüber hinaus viel besser skalierbar ist. Dafür wird 800-V-Hochspannungsgleichstrom (HVDC, high-voltage direct current) genutzt, der eine Stromumwandlung direkt an der GPU innerhalb des Servers ermöglicht.
Derzeit ist die Stromversorgung in Racks und Rechenzentren zudem dezentralisiert, GPUs werden von einer großen Anzahl von Netzteilen mit Strom versorgt. Die zukünftige Systemarchitektur wird zentralisiert sein und den begrenzten Platz in einem Server-Rack bestmöglich nutzen. Durch den Wegfall von Netzteilen in Racks will Nvidia die Wartungskosten um bis zu 70 Prozent drücken – Netzteile gelten als anfällig und müssen öfter getauscht werden.
Allein dieser Aufbau der gesamten Infrastruktur ist ein jahrelanges Unterfangen, welches mit Kyber die ersten Früchte trägt. Die frühe Offenlegung für OCP-Standards soll auch hier helfen, Partner für die Systeme fit zu machen.
ComputerBase hat Informationen zu diesem Artikel von Nvidia unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.