Apps & Mobile Entwicklung
RTX Pro Server: Nvidia bringt Blackwell in das gängige 2U-Format
Nvidia erweitert zur Fachmesse SIGGRAPH 2025 für Computergrafik das Angebot der sogenannten RTX Pro Server um eine neue Lösung im gängigen 2U-Format mit 3,5 Zoll Höhe. Das soll die KI-Beschleuniger in bestehende Rechenzentren älteren Aufbaus und damit in den Mainstream bringen. Noch zwei RTX Pro 6000 kommen darin zum Einsatz.
Den RTX Pro Server und die darin zum Einsatz kommenden KI-Beschleuniger und Grafikkarten hatte Nvidia zur Hausmesse GTC im März dieses Jahres angekündigt und die Verfügbarkeit fertiger Server von namhaften Anbietern im Mai zur Computex folgen lassen. Reduziert auf die darin verbauten KI-Beschleuniger war ein RTX Pro Server bislang eine 4U und damit 7 Zoll hohe Lösung mit acht RTX Pro 6000 Server. Das sind zunächst passiv, aber letztlich über den Luftstrom im Servergehäuse aktiv gekühlte Beschleuniger mit dem (derzeitigen) Vollausbau des GB202 mit 24.064 FP32-ALUs.
Kleineres 2U-Format für den Mainstream
Zur SIGGRAPH stellt Nvidia den RTX Pro Server auch im gängigen 2U-Format mit einer Höhe von lediglich 3,5 Zoll vor. Betreibern von Rechenzentren soll damit eine Lösung in einem Format angeboten werden, das sich leichter in bestehende Infrastrukturen integrieren lässt, weil es weniger Platz im Rack benötigt. Weniger der zuvor verbauten Hardware muss weichen, das soll den Umstieg vereinfachen und Nvidia in den Mainstream verhelfen.
Zwei RTX Pro 6000 werden waagerecht verbaut
Aufgrund der Höhenbeschränkung und des allgemein geringeren Volumens kommen in der 2U-Variante des RTX Pro Server nicht mehr acht RTX Pro 6000 senkrecht positioniert, sondern zwei RTX Pro 6000 waagerecht verbaut zum Einsatz. Die Karten sind gemeinsam mit Netzwerkkomponenten im hinteren Bereich des Servers verbaut, wie ein Schaubild von Nvidia verdeutlicht. Die neuen RTX Pro Server sind x86-basiert, wie Nvidia im Vorgespräch anmerkte, die Spezifikationen stehen noch aus.
Leistung im Vergleich zu L40S und CPU-Servern
Nvidia sieht die neue Lösung auch als möglichen Ersatz für bisherige 2U-Server mit der L40S-GPU, die noch auf Ada Lovelace (AD102) basiert, und zieht entsprechende Vergleiche. Demnach liefere die neue Generation viermal mehr FPS beim Echtzeit-Rendering im Omniverse, allerdings gemessen mit DLSS4 vs. DLSS3, den sechsfachen Durchsatz beim LLM-Inferencing, hier jedoch mit FP4 vs. FP8, und eine viermal so schnelle synthetische Datengenerierung für Text-zu-Video für einen 2,5 Sekunden langen Clip in 720p – auch hier im Vergleich von FP4 (Blackwell) vs. FP8 (Ada Lovelace).
Wer mit einem RTX Pro Server im 2U-Format einen reinen CPU-Server ablöst, soll laut Nvidia die 45-fache Leistung (geometrisches Mittel) erhalten. Dabei bezieht sich der Anbieter auf eine Mischung aus „Enterprise Workloads“, genauer gesagt HPC-Anwendungen unter Verwendung von FP32, das Rendering mit VRed, Spark RAPIDS und das HEVC-Encoding in 1080p. Für diesen Vergleich macht Nvidia dann auch Angaben zum Verbrauch: 3 kW sind es für den RTX Pro Server mit zwei RTX Pro 6000 und zwei x86-CPUs, 1,1 kW für den reinen CPU-Server mit zwei Prozessoren.
Verfügbarkeit später im Jahr
Während die 4U-Variante des RTX Pro Server bereits von mehreren Anbietern verfügbar ist, sollen die neuen 2U-Modelle „später im Jahr“ folgen. Die Systempartner sind zum Start Cisco, Dell, HPE, Lenovo und Supermicro. Dell will die PowerEdge R7725 2U Server auch als Teil der Nvidia AI Data Platform anbieten, einem anpassbaren Referenzdesign für KI-Server. Weitere RTX Pro Server im 2U-Format sollen später auch von Advantech, Aetina, Airves, ASRock Rack, Asus, Compal, Foxconn, Gigabyte, Inventec, MiTAC Computing, MSI, Pegatron, Quanta Cloud Technology (QCT), Wistron und Wiwynn folgen.
ComputerBase hat Informationen zu diesem Artikel von Nvidia unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.