Künstliche Intelligenz

Google Brazos: Flüssigkeitskühlung für luftgekühlte Rechenzentren


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Google packt mit seinem neuen Kühlsystem Brazos ein wachsendes Problem in Rechenzentren an: Moderne Chips für künstliche Intelligenz und High-Performance Computing (HPC) überschreiten regelmäßig eine Thermal Design Power (TDP) von 1000 Watt. Herkömmliche Luftkühlung stößt bei dieser thermischen Last an ihre physikalischen Grenzen. Bisher blieb Betreibern oft nur der kostspielige und zeitintensive Umbau der Facility-Infrastruktur auf wassergekühlte Systeme.

Weiterlesen nach der Anzeige

Brazos soll diesen Prozess drastisch vereinfachen. Das System ist als Rack-basiertes, geschlossenes Liquid-to-Air-Modul konzipiert. Es erlaubt den Einsatz von flüssigkeitsgekühlter Hardware mit hoher Leistungsdichte in bestehenden, luftgekühlten Rechenzentrumsumgebungen. Statt das gesamte Gebäude aufwendig mit Kühlwasserkreisläufen auszustatten, lassen sich einzelne Racks modular nachrüsten. Laut Google ermöglicht dies eine One-rack-at-a-time-Strategie, bei der die Installation so unkompliziert wie bei Standard-Luftkühlungen bleibt.



(Bild: Google)

Technisch fungiert Brazos als geschlossene Kühleinheit, die Wärme direkt an den Komponenten aufnimmt und über hocheffiziente Wärmetauscher an den Warmgang des Rechenzentrums abgibt, wo sie von der vorhandenen Luftführung aufgenommen wird. Die Trennung zwischen dem IT-internen Kühlkreislauf und der Facility-Infrastruktur ist dabei der entscheidende Vorteil: Der Betreiber muss keine neuen Wasserleitungen durch das Gebäude verlegen.

Das Design ist auf den OCP-Standard ausgelegt. Das Open Compute Project ist eine 2011 von Facebook angestoßene, branchenweite Initiative, die offene Hardware-Spezifikationen für Rechenzentren entwickelt. Ziel ist es, durch standardisierte Designs die Effizienz zu steigern, Kosten zu senken und die Skalierbarkeit für Hyperscaler und Enterprise-Anwender zu verbessern.

Weiterlesen nach der Anzeige

Jede Brazos-Einheit belegt 11 Open Units (OU) an Rack-Höhe und ist für die Integration in OCP-ORv3-Racks optimiert. Ein voll ausgebautes System aus drei Einheiten unterstützt eine thermische Last von bis zu 60 Kilowatt pro Rack. Als Kühlmittel kommen wahlweise deionisiertes Wasser oder ein 25-prozentiges Propylenglykol-Gemisch (PG25) zum Einsatz. Die Energieversorgung erfolgt über einen 40- bis 60-Volt-Gleichstromanschluss, der direkt mit den Busbars des Racks verbunden wird.

Für den Betrieb ist zudem ein Monitoring integriert. Das System lässt sich lokal über ein Human-Machine-Interface (HMI) bedienen; für die Fernwartung steht ein Modbus-over-TCP-Protokoll bereit. Google hat bei der Konstruktion zudem auf die Wartungsfreundlichkeit geachtet. Die Einheiten sitzen auf Gleitschienen und lassen sich für Reparaturen leicht aus dem Rack ziehen. Pumpen und Lüfter sind als hot-swappable Field Replaceable Units (FRUs) konzipiert, was die durchschnittliche Reparaturzeit (MTTR) minimieren soll.

Google plant, die technischen Spezifikationen, Design-Prinzipien und visuellen Assets in den kommenden Monaten über die Foren des Open Compute Project öffentlich zugänglich zu machen. Anschließend lassen sich die Entwürfe evaluieren, um die Kühlung für künftige Hochleistungsrechner-Architekturen zu skalieren. Darüber hinaus ist das System bereits allgemein verfügbar; die Fertigungspartner sind laut Google bereit, die Brazos-Designs für den breiteren Markt zu produzieren und anzubieten. Technische Details finden Interessierte in der offiziellen Vorstellung von Brazos.


(fo)



Source link

Beliebt

Die mobile Version verlassen