Apps & Mobile Entwicklung
>15 AI-ExaFLOPS mit Nvidia: Der HammerHAI-Supercomputer am HLRS kommt von HPE

Einer Ausschreibung der European High Performance Computing Joint Undertaking (EuroHPC JU) folgend, wird HPE einen KI-optimierten Supercomputer für die AI Factory HammerHAI am Höchstleistungsrechenzentrum Stuttgart (HLRS) bereitstellen. Die Lösung basiert auf Nvidias GB200-NVL4-Architektur und wird über 15 AI-ExaFLOPS bieten.
HammerHAI steht für Hybrid and Advanced Machine Learning Platform for Manufacturing,
Engineering, and Research. HammerHAI soll KI-optimierte Rechnerinfrastruktur und Services für Branchen wie Mobilität, Maschinenbau und Fertigung unterstützen und zielt insbesondere auf Start-ups und KMU in allen Sektoren ab. Ende 2024 ins Leben gerufen wird die Lösung nun zeitnah umgesetzt. HPE wird im zweiten Quartal dieses Jahres die Systeme liefern, im zweiten Halbjahr soll das Gesamtsystem dann auch direkt einsatzbereit sein.
Nvidias GB200 NVL4 by HPE ist ein spezielles Blade, welches auf sehr wenig Raum die höchste Leistung in Form einer Vielzahl von Chips unterbringt. 34 Blades passen in ein klassisches 48U hohes MGX-Rack auf Basis von Nvidias Referenzdesign, ob das genau so für HammerHAI umgesetzt ist, wurde aber noch nicht preisgegeben, das Schaubild deutet auf ein leicht angepasstes Design hin.
Im Detail dürfte das aber für das einzelne Blade gelten: Vier B200-GPUs arbeiten mit zwei Grace-CPU auf einem großen PCB zusammen, komplett flüssigkeitsgekühlt versteht sich heutzutage. Die Leistung der Beschleuniger liegt bei 40/80 PFLOPs (dense/sparse) in FP4-Anwendungen, 40 TFLOPS in FP64, pro GPU stehen 186 GB HBM3e mit einer Geschwindigkeit von 8 TB/s zur Verfügung. Nvidias Quantum-X800 InfiniBand wird als Netzwerklösung für die Skalierung sorgen.
Für die Speicherarchitektur des Supercomputers wird am HLRS auf eine VAST Data DASE zurückgegriffen, die eine einheitliche Datenplattform für KI- und HPC-Workloads bietet. Das System wird eine Partition auf Basis von KI-optimierten Inferenz-Engines und Hardware-Beschleunigern des niederländischen Unternehmens Axelera AI enthalten. Die HPE Morpheus Enterprise-Software wird wiederum als einheitliche KI-Steuerungsebene eingesetzt.
Als Budget wurden 55 Millionen Euro für Kauf, Lieferung, Installation und auch Wartung zur Verfügung gestellt. Das Geld kommt zur Hälfte aus dem Topf der EuroHPC JU, die anderen 50 Prozent vom Bundesministerium für Forschung, Technologie und Raumfahrt sowie vom Ministerium für Wissenschaft, Forschung und Kunst des Landes Baden-Württemberg.