Künstliche Intelligenz

Arista 7060XE7: 1,6-Tbit/s-Switches für KI-Netzwerke

Arista hat eine neue Switchserie namens 7060XE7 mit bis zu 64 Ports mit je 1,6 Tbit/s auf vier Höheneinheiten angekündigt. Die Serie basiert auf dem aktuellen Broadcom Tomahawk 6 Chip und soll Latenzen von nur 840 Nanosekunden unter optimalen Bedingungen für die Weiterleitung von Paketen benötigen. Der Hersteller bietet das Modell sowohl mit klassischer Luftkühlung als auch mit Flüssigkeitskühlung an. Als Referenzkunden sind Meta, Microsoft, Oracle benannt, wobei die Kundenstatements-Videos auch OpenAI, Anthropic und Google zeigen.

Weiterlesen nach der Anzeige

Die Gesamtswitching-Kapazität der Switche beträgt jeweils bis zu 102,4 Tbit/s. Diese verteilen sich bei dem luftgekühlten 7060XE7-64PS/PRS und dem flüssigkeitsgekühlten 7060XE7-64PRS-RV3-L auf 64 Slots für OSFP-Transceiver mit 1,6 Tbit/s und beim 7060XE7-128PE auf 128 Slots für OSFP-Transceiver mit 800 Gbit/s. Die Ports können je nach Bedarf aber auch auf 800G, 400G und 200G heruntergebrochen werden und unterstützen zudem Linear Pluggable Optics (LPO)-Transceiver, die keinen DSP mehr, sondern nur einen Transimpedanzverstärker (TIA) und einen Treiber-Chip besitzen.

Die Ports haben geringere Latenz sowie einen geringeren Stromverbrauch, was weniger Abwärme bedeutet. Arista gibt 60 Prozent geringeren Stromverbrauch an, wohingegen andere Hersteller konservativer bis zu 50 Prozent angeben. Jedoch muss der ASIC diese Transceiver unterstützen, was bei den 7060XE7 der Fall ist. Die 1,6T-Ports teilen sich auf 8 × 200G-Lanes gemäß 224G-SerDes auf. Bei der 800G-Variante kommt entsprechend 100G-SerDes zum Einsatz. Beide Varianten nutzen PAM4-Modulation.

Die luftgekühlten Chassis kommen auf vier 19-Zoll-Höheneinheiten daher, wohingegen der flüssigkeitsgekühlte 7060XE7-64PRS-RV3-L nur zwei Open Rack Units gemäß Open Rack v3 Spezifikation benötigt, was nur 9,6 cm in der Höhe entspricht. Er kann entweder als reiner Switch oder im vorbereiteten Behältnis für die Kühlung in integrierten Racks geliefert werden.

Die Netzteile und Lüfter der luftgekühlten 64-Port-Chassis sind redundant und wie auch die Supervisor Engine im Betrieb austauschbar. Dabei stehen sowohl Wechselstrom- als auch Gleichstromvarianten zur Verfügung. Die flüssigkeitsgekühlte Variante hat Gleichstromnetzteile. Als Paketpuffer stehen 267 MB bereit.

Funktionen für KI-Backend-Netzwerke

Besonders relevant für die Zielgruppe des Switches sind jedoch die speziellen Funktionalitäten für KI-Backend-Netzwerke. Für die Lastverteilung beherrschen sie Dynamic Load Balancing (DLB) und Cluster Load Balancing (CLB). Diese werden eingesetzt, um die Bearbeitungszeiten von Aufträgen zu steuern und die Lastverteilung über das gesamte Netzwerk zu optimieren.

Weiterlesen nach der Anzeige

Zudem bringen sie auch ein erweitertes Überlastmanagement auf Basis Priority Flow Control (PFC) fähiger Lastverteilung und PFC-fähigen Überlastbenachrichtigungen (ECN), Fast CNP (Congestion Notification Packet), CSIG (Congestion Signaling) und auch ein Kürzen der Nutzdaten statt des Verwerfens des gesamten Pakets (Packet Trimming) für KI-Workloads mit. Zudem unterstützen die Switche auch Packet Spraying.

Verbindungsoptimierung mit MRC

Als ein besonders relevantes Merkmal benannte Arista auf Anfrage die Unterstützung von MRC (Multipath Reliable Connection). Durch die vollständige Unterstützung des offenen Protokolls MRC wird erreicht, dass ein einzelner Verbindungsausfall einen umfangreichen KI-Trainingsvorgang nicht zum Stillstand bringt. Dabei werden Daten schon in der Netzwerkkarte (NIC) an der XPU auf unterschiedliche Links/Pfade aufgeteilt und Out-of-Order-Pakete automatisch gehandhabt.

MRC reagiert auf Signale zur Netzwerküberlastung (ECN und Packet Trimming), verlagert die Last auf die leistungsstärksten Pfade und meidet Verbindungen und Pfade, die das Ziel gar nicht erreichen können. Eine weitere optimierte Verteilung soll über die Kombination von MRC mit Segment Routing v6 (SRv6) erreicht werden, um den Datenverkehr der XPU bereits an der Quelle besser zu steuern. Ansonsten verfügen sie über die klassischen Features im Arista EOS-Netzwerkbetriebssystem.

Ethernet statt InfiniBand

Arista positioniert die Switche für Scale-up und Scale-out-Szenarien, also eine Verbindung von XPUs innerhalb (Scale-up) oder zwischen Racks in einem Rechenzentrum (Scale-out). Die beiden luftgekühlten 7060XE7-64PS/PRS sollen im vierten Quartal 2026 verfügbar sein, wohingegen der 7060XE7-128PE und der flüssigkeitsgekühlte 7060XE7-64PRS-RV3-L erst im ersten Quartal 2027 bereitstehen sollen. Zu Preisen machte der Hersteller, wie gewohnt, keine Angaben.

Mit den vielfältigen Optimierungen für die Steuerung von latenz- und verlustkritischen Applikationen, wie KI-Trainings, den hohen Bandbreiten bringt Arista Ethernet zunehmend als Alternative zu InfiniBand ins Spiel. Die genannten Hyperscaler und KI-Pioniere sprechen dabei eine deutliche Sprache. Für die meisten Unternehmenskunden dürften die Switche jedoch mindestens eine Nummer zu groß sein.

(axk)

Source link

Verwandte Themen:16TbitsSwitches 7060XE7 Arista Ethernet Flüssigkeitskühlung Fur Infiniband IT KI-Netzwerke KINetzwerke Latenz Rechenzentrum Switch

Inspohub