Apps & Mobile Entwicklung

Supercomputer: Tesla löst Dojo-Team auf und nutzt Auto-Chips fürs Training


Supercomputer: Tesla löst Dojo-Team auf und nutzt Auto-Chips fürs Training

Bild: Tesla

Einem Medienbericht zufolge hat Tesla das Team hinter dem eigenen Dojo-Supercomputer aufgelöst und soll künftig einen anderen technischen Ansatz für das Training von Machine-Learning-Modellen verfolgen. Konzernchef Elon Musk hat den Bericht zwischenzeitlich bestätigt, jedoch mit anderen Konsequenzen für Tesla.

Dojo war ein von Tesla im August 2021 erstmals öffentlich gezeigtes Supercomputer-Konzept mit einer Architektur, die eigens entwickelte D1-Chips mit jeweils 354 Kernen zu einem 5-mal-5-Raster (25 Chips mit 8.850 Kernen) auf einem Tile (Kachel) verbindet, davon sechs Stück auf einem System-Tray unterbringt und davon wiederum zwei in einem Cabinet verstaut, wovon insgesamt zehn Stück schließlich den ExaPOD bilden.

Tesla Dojo Architektur (Bild: Mliu92, CC BY-SA 4.0)

Ex-Mitarbeiter haben Konkurrenten gegründet

Der eigene Supercomputer wurde für das Training von Machine-Learning-Modellen mit Videodaten der Fahrzeugflotte von Tesla entwickelt, um das Full Self-Driving (FSD) mit dem Ziel des autonomen Fahrens weiter zu verbessern. Dieses Team sei nun aber aufgelöst worden, berichtet Bloomberg, die eigene Architektur scheint damit am Ende. Projektleiter Peter Bannon habe das Unternehmen verlassen und CEO Elon Musk die Einstellung der weiteren Entwicklung angeordnet. Das Team soll im Verlauf des Jahres rund 20 Mitarbeiter an das Start-up DensityAI verloren haben, das ebenfalls im Automotive- und Robotik-Sektor für autonome Maschinen mitmischen will. DensityAI wurde von Ganesh Venkataramanan, D1-Architekt und ehemaliger AMD-CPU-Designer, und den ehemaligen Tesla-Mitarbeitern Bill Chang und Benjamin Floering gegründet.

Dem Bericht zufolge soll Tesla anstelle von Dojo-Hardware zukünftig mehr auf die Lösungen externer Partner setzen, explizit genannt werden AMD und Nvidia für „Compute“, also für die Rechenleistung, die für das Training und potenziell auch Inferencing benötigt wird, sowie Samsung für die Chip-Produktion.

Musk will Auto-Chips für das Training nutzen

Später äußerte sich Tesla-CEO Elon Musk auf X allerdings selbst zu dem Bericht und stellte die Situation respektive die Konsequenzen daraus anders dar. In seinem Beitrag bestätigte er aber, dass es für Tesla keinen Sinn ergebe, die Ressourcen auf zwei stark unterschiedliche Chip-Designs zu verteilen. Gemeint sind damit die Dojo-Chips im Rechenzentrum und die AI-Chips mit abweichender Architektur im Auto.

Die im Auto verwendeten Chips AI5, AI6 und darauf folgende seien „exzellent für das Inferencing“ und zumindest noch „ziemlich gut“ für das Training, so Musk. Alle Anstrengungen seien derzeit darauf ausgerichtet. In einem Supercomputer-Cluster ergebe es Sinn, mehrere AI5- und AI6-Chips auf ein Board zu setzen, um die Komplexität der Netzwerk-Verkabelung und damit die Kosten massiv zu reduzieren. Man könne solch eine Lösung dann durchaus „Dojo 3“ nennen, so Musk. Für den Firmenchef scheint das Projekt zumindest vom Namen her damit noch nicht vollständig abgeschlossen zu sein.



Source link

Beliebt

Die mobile Version verlassen