Künstliche Intelligenz
Instinct MI350X/MI355X: AMD opfert Compute- für KI-Rechenleistung
AMD hat am 12. Juni 2025 auf seiner Hausveranstaltung Advancing AI im kalifornischen San José die kommenden Instinct-Beschleuniger MI350X und MI355X offiziell vorgestellt und einen Ausblick auf MI400 im nächsten Jahr gegeben. Die beiden MI35xer-Modelle kommen mit bis zu 288 GByte HBM3e-Stapelspeicher (High-Bandwidth Memory) und nehmen im Fall der MI355X mit direkter Flüssigkühlung 1,4 bis 1,5 Kilowatt Leistung auf. Laut AMD sollen Sie gegenüber den MI300X-Vorgängern beim KI-Inferencing rund 2,6 bis 4,2 Mal so schnell sein. Nvidias CPU-GPU-Kombi GB200 sollen sie beim KI-Training Paroli bieten oder im Vergleich zum B200-Beschleuniger bis zu 30 Prozent Vorsprung bieten.
Damit will AMD sich einen Anteil am riesigen KI-Geldtopf sichern, an dem sich Nvidia seit Jahren finanziell labt und in den Börsenberichten ein Rekordquartal nach dem anderen meldet. AMD wirbt mit einer bis zu 40 Prozent höheren Durchsatzrate pro Dollar (Tokens/$), die sich aus den maximal 30 Prozent höheren Durchsatz nur zum Teil speist – zusätzlich muss AMD die MI355X auch billiger anbieten als Nvidias B200-Systeme.
AMDs Instinct-Reihe sind massiv parallele Beschleuniger, die speziell für den Einsatz in Rechenzentren vorgesehen sind; die MI350X und MI355X verwenden mit CDNA4 die vierte Generation dieser Rechenbeschleuniger. Beide haben eine Speichertransferrate von bis zu 8 TByte/s und unterscheiden sich hauptsächlich in Sachen Taktrate und Leistungsaufnahme. Die MI350X ist mit 1 kW vergleichsweise zahm. Sie ist mit einem Durchsatz von 72 zu 79 Billionen Rechenschritten bei doppeltgenauen Gleitkommazahlen (FP64-TFLOPS) auf dem Papier aber nur knapp 9 Prozent langsamer als die wesentlich stromdurstigere MI355X. Letztere soll bis zu 1,4 kW, also 40 Prozent mehr als die kleinere Schwester aufnehmen. In einer Vorschau nannte ein AMD-Sprecher sogar bis zu 1,5 kW.
Übersicht AMD Instinct MI350X und MI355X.
(Bild: AMD)
AMD sieht die MI350X für den Einsatz in luftgekühlten Serverschränken mit bis zu 64 GPUs vor. Die MI355X soll in hochdichten Racks mit bis zu 128 GPUs unterkommen, benötigt dann aber direkte Flüssigkühlung (DLC), um nicht zu überhitzen.
Dass AMD weitere Schritte in Richtung KI-Optimierung geht, überrascht indes nicht. Einerseits liegt dort gerade das große Investorengeld, andererseits hatte AMDs Technikchef Mark Papermaster auf der ISC25 in Hamburg erst vor zwei Tagen die Wichtigkeit von Berechnungen mit gemischter Präzision hervorgehoben. Eine Version mit integrierten CPU-Chiplets analog zum MI300A hat AMD vom MI350 bisher nicht erwähnt.
Ein Schritt vor, ein Schritt zurück
Der Fokus lag bei den Vorgängern aus der MI300/325-Reihe noch auf der Verwendung in Supercomputern und Rechenzentren gleichermaßen. Das hat AMD bei der MI355X geändert. Die Rechenwerke sind für den Einsatz bei KI-Aufgaben weiter optimiert, müssen dafür aber Federn bei klassischen Aufgaben lassen. Pro Takt und Rechenwerk gibt es sogar Rückschritte.
Wie schon bei den älteren Instinct-MI-Modellen verwenden die AMD-Ingenieure bei der MI355X auch 3D-Chiplets. Als Basis kommen zwei IO-Dies zum Einsatz, die in bewährter 6-Nanometer-Technik gefertigt werden. Darin sind insgesamt 256 MByte Infinity-Cache enthalten, aufgeteilt in 2-MByte-Blöcke, sowie die sieben Infinity-Fabric-Links (IF) der vierten Generation, die pro Stück jetzt 153,6 GByte/s übertragen und mit insgesamt 1075 GByte pro Sekunde bis zu acht MI35xX verbinden. Auch die 5,5 TByte/s schnelle Verbindung der beiden IO-Dies hat AMD überarbeitet: Sie ist jetzt breiter, taktet dafür aber niedriger. Dadurch lässt sich die nötige Spannung als Haupttreiber der Leistungsaufnahme senken. AMD nennt diese Verbindung der beiden IO-Dies Infinity Fabric Advanced Package (IF-AP).
Chiplet-Technik mit 3D-Stacking: Zwei IO-Dies in 6- und acht XCDs in 3-nm-Technik.
(Bild: AMD)
Auf den beiden IO-Dies sitzen die acht Accelerator Compute Dies (XCDs), die TSMC im moderneren N3P-Prozess herstellt. In jedem davon sind 32 aktive Compute-Units enthalten – vier sind zur Verbesserung der Chipausbeute deaktiviert. Wer sich gut Zahlen merken kann, dem fällt auf, dass der Vorgänger mit 304 CUs noch 48 Einheiten mehr hatte. Auch dadurch ist die Versorgung mit Daten aus dem HBM3e-Speicher nun um Faktor 1,5 besser als zuvor: 16 Prozent weniger CUs, 30 Prozent mehr Transferrate.
Das geht laut AMD auf Erfahrungen aus der Praxis zurück, die den präferierten KI-Anwendungen einen hohen Bandbreitenhunger attestieren. Ein weiterer Eingriff an der Architektur ist ein größerer schneller Zwischenspeicher innerhalb der CUs (Local Data Share, LDS) auf 160 KByte. Mit dem größeren HBM-Speicher und der Überarbeitung der Speichervirtualisierung einher geht auch die Anpassung der sogenannten Universal Translation Caches, die ähnliche Aufgaben übernehmen wie die Translation Lookaside Buffer (TLBs) in Prozessoren. Der TLB enthält oft benutzte Zuordnungen von virtuellen zu physikalischen Adressen. Bei einem Speicherzugriff wird die Zuordnung zunächst im TLB gesucht, bevor Page Directory/Table konsultiert werden. Ist sie im Cache vorhanden, spricht man von einem „Hit“, ansonsten von einem „Miss“. Die Suche im TLB ist erheblich schneller als ein Zugriff auf die Page Table.
Der größte Unterschied ist aber der Aufbau der einzelnen Rechenwerke in den Compute Units. Denen hat AMD neue Datenformate spendiert, sodass die Matrixeinheiten jetzt außer FP8 (sowohl nach OCP-FP8- als auch OCP-MX-Spezifikation wie bei Nvidia) auch FP6 und FP4 beherrschen. Der Durchsatz der beiden neuen Formate ist dabei doppelt so hoch wie der des bekannten FP8 – bei Nvidias B200 erreicht FP6 nur FP8-Geschwindigkeit.
Dafür mussten speziell die dicken Multiplizierer der Matrixeinheiten bluten. Der Durchsatz mit FP64-Datenformaten, wie sie in KI-Anwendungen allerdings nicht vorkommen, wurde gegenüber den Vorgängerbeschleunigern halbiert. Damit folgt AMD auch hier Nvidias Marschrichtung, der FP64 schon länger bedeutend niedriger priorisiert. Die Vektoreinheiten, die den klassischen Shader-SIMDs in Grafikkarten ähneln, wurden beim MI350X/MI355X allerdings nicht angetastet.
Durchsatz bei verschiedenen Datenformaten: Mit FP6 und FP4 läuft der MI350 zur Hochform auf.
(Bild: AMD)
Die kompletten Chips schaffen laut AMD daher nun einen Durchsatz von bis zu 20.000 TFLOPS bei dünn besetzten Matrizen („Sparsity“) mit FP6- oder FP4-Genauigkeit. Mit FP8 oder INT8 ist es noch die Hälfte, ebenso wie bei regulär besetzten Matrizen.
AMD will auch Racks mit MI350X anbieten.
(Bild: AMD)
„Helios“-KI-Racks und Ausblick auf MI400
AMD will mit MI355X und MI350X erstmals auch eigene KI-Racks spezifizieren. Die Basis bilden weiterhin UBB8-Formate, Universal Base Boards für acht Beschleunigermodule, die es von Partnern auch weiterhin geben wird. Neu sind die KI-Serverschränke mit bis zu 128 MI355X-Beschleunigern und Direct Liquid Cooling. Ein solcher Schrank soll dann 2,57 Exaflops an KI-Rechenleistung im FP6/FP4-Format schaffen und 36 TByte HBM3e-Speicher beherbergen. AMD betonte zudem erneut, dass die hauseigene Lösung komplett auf offene Standards wie OCP-UBBs oder Ethernet des Ultra-Ethernet-Consortiums setzt. Die Firma will sich damit von Nvidias proprietären Server-Racks mit NVLink differenzieren.
Der Nachfolger MI400 soll 2026 erscheinen und es mit dem dann erwarteten Vera Rubin von Nvidia aufnehmen, auch als Komplettlösung in neu entwickelten Helios-Racks analog zu Nvidias NVL72. AMD stellt für 72 MI400 rund 50 Prozent mehr HBM4-Speicherkapazität (31 TByte, addiert) und -Transferrate (1,4 PByte/s, addiert) sowie Scale-Out-Bandbreite (also der ins Netzwerk) in Aussicht. Einen Gleichstand erwartet die Firma bei FP4/FP8-Rechenleistung sowie bei der Scale-Up-Bandbreite der lokalen HBM-Kanäle.
Helios heißen die Rack-Designs für die 2026 erwarteten Nvidia-Rubin-Konkurrenten MI400.
(Bild: AMD)
Ein einzelner MI400 soll die FP4-Leistung gegenüber MI355X auf 40 Petaflops (40.000 Teraflops, inkl. Sparsity) verdoppeln und 432 GByte HBM4-Stapelspeicher mit bis zu 19,6 TByte/s anbinden. Jede GPU wird mit 300 GByte nach außen doppelt so schnell kommunizieren können wie MI350X/355X. Wie hoch die Leistungsaufnahme dann sein wird, hat AMD nicht verraten, wohl aber in einem irreführenden Diagramm einen enormen Performancevorsprung suggeriert. Der wurde laut der Fußnoten offenbar auf Plattformbasis errechnet: 72 MI400 gegen acht MI355X, darum geben wir ihn hier auch nicht grafisch wieder.
(csp)
Künstliche Intelligenz
Mit Regex und WordWrap: Das taugt der Open-Source-Editor Edit für Windows 11
Microsoft hat einen neuen Open-Source-Texteditor für Windows entwickelt: edit.exe. Diese Nachricht allein und die Behauptung, das Programm lehne sich an Visual Studio Code an, hat für ein ordentliches Rauschen im Online-Blätterwald gesorgt.
(Bild: Susanne Krauss )
David Göhler ist seit 38 Jahren IT-Journalist und hat seine Ausbildung 1987 bei c’t als Volontär begonnen. Er hat mehr zehn Programmiersprachen gelernt und entwickelt als Hobby immer noch Software. Aktuell arbeitet er hauptberuflich als Senior-Content-Specialist bei einer Münchener PR-Agentur. Außerdem engagiert er sich politisch als Gemeinderat in einer bayrischen Gemeinde.
Prinzipiell ist ein Texteditor, der in der Konsole arbeitet und kein eigenes Fenster öffnet, sehr sinnvoll, weil man so eine Anwendung vor allem braucht, wenn man remote auf einem anderen System aktiv ist (etwa per ssh). Da es die Anwendung früher noch als DOS-Programm (edit.com) unter 32-Bit-Windows-Versionen gab und sie bei dem Wechsel zu 64 Bit entfernt wurde, entstand eine Lücke. Die soll das neue Edit jetzt offenbar füllen, da es auch in 64-Bit-Windows 10 und 11 läuft.
edit.exe ist schnell installiert: Ein Aufruf im Terminal mit winget install Microsoft.Edit
reicht aus. Der Editor besteht nur aus der Exe-Datei und ist 230 KByte groß. Er legt auch keine Konfigurationsdateien an, weil es nichts zu konfigurieren gibt. Das zugehörige GitHub-Verzeichnis zeigt, dass das Programm komplett in Rust geschrieben ist. Während des Tests erschien schon die Version 1.2, an dem Programm wird also flott und aktiv weiterentwickelt.
Erwartungsgemäß startet Edit rasend schnell und hat auch mit Dateien mit mehreren zehntausend Zeilen kein Problem. Am oberen Bildschirmrand ist ein Menü zu sehen, das sich mit der Maus bedienen lässt. In ihm kann man auch die Tastaturkürzel ablesen. Eine Hilfe oder sonstige Übersicht zu Tastenbelegungen gibt es nicht.
Die Funktionen, die das Programm beherrscht, sind schnell erzählt. Es gibt ein Suchen und Ersetzen, und beim Suchen lassen sich auch reguläre Ausdrücke (Regex) verwenden, beim Einsetzen nicht. Der Editor kann mehrere Dateien gleichzeitig öffnen und dann zwischen diesen wechseln. Als Tabs werden sie aber nicht angezeigt.
Für lange Zeilen kann man ein WordWrap – einen automatischen Zeilenumbruch – einschalten. In der 1.0.0-Version war das noch fehlerhaft (relativ schnell waren Cursor und Einfügeposition nicht mehr synchron). In der aktuellen Version 1.1.0 ist das WordWrap aber stabil. Und das war’s an Funktionalität. Es gibt keine Plug-ins, kein Split Windows oder Tabs, kein Syntax-Highlighing oder Themes, keine Makros, keine Mehrfachcursor oder vertikale Blockmarkierungen. Auch ist es nicht möglich, Tasten anders zu belegen oder überhaupt etwas zu konfigurieren.
Übersichtlich und funktionsarm: Edit ist absolut rudimentär, dafür aber schnell.
(Bild: Screenshot)
Damit taugt das Programm nur fürs Anpassen von Konfig-Dateien und kleine Eingriffe in Text- und Sourcecode-Dateien. Zum Entwickeln ist es unbrauchbar.
Alternativen sind GNU Nano oder, noch besser, Micro
Wie eingangs erwähnt, ist ein Texteditor in der Textkonsole dennoch gelegentlich sehr praktisch. Oft werden dann schnell die Dinosaurier Emacs und Vim oder das moderne Helix ins Feld geführt, die wahre Feature-Monster sind, aber von Haus aus kryptische und unzählige Tastaturkombinationen verwenden. Sich diese zu merken, wenn man die Programme nur gelegentlich nutzt, ist nahezu unmöglich.
Allerdings gibt es praktische Alternativen. Schon etwas länger etabliert ist der schlanke GNU Nano, der allerdings standardmäßig für Windows-Anwender gewöhnungsbedürftige Tastenkombinationen verwendet. Er ist aber auf jedem Linux-System installiert.
Für Windows-Anwenderinnen und -Anwender noch besser ist Micro, mit dem auch dieser Text entstanden ist. Micro hat vieles, was man sich von einem modernen Editor wünschen kann und bietet das unter Windows, Mac und Linux gleichermaßen. Der Editor ist ebenfalls kostenlos und Open Source und lässt sich mit dem Einzeiler winget install micro
unter Windows installieren. Das Gute ist: Im Gegensatz zu mancher Linux-Portierung ist dieser Editor kein riesengroßes Feature-Grab mit kryptischen Tastensteuerungen.
Im Standard sind die Tasten so belegt, wie man es erwartet: Strg+S sichert, Strg+O öffnet eine Datei, Strg+Q schließt das Fenster. Strg+C, +V und +X funktionieren wie gewohnt; Strg+F startet die Suche. Auch Pfeile, Seitentasten, Pos1 und End sowie andere Extra-Tasten arbeiten erwartungsgemäß. Mit der Maus lässt sich Text markieren und mit dem Mausrad durch den Text scrollen. Micro ist in Go programmiert und genauso rasend schnell wie Microsofts Edit.
Alles drin und eingängig zu bedienen: Mit Micro lassen sich Texte wie in einer großen Windows-App bearbeiten.
(Bild: Screenshot)
Wer den Editor also nur ab und an startet, um etwas in einer Textdatei anzupassen, muss sich nichts merken und sich an nichts gewöhnen. Wer ihn allerdings häufiger verwenden möchte, kann auf viele Funktionen zurückgreifen:
- Syntax-Highlighting für viele Textformate (HTML, JSON, Markdown, Ini-Dateien) und Programmiersprachen (130 insgesamt)
- Split Views (horizontal und vertikal) und Tabs
- Mehrfachcursor und vertikale Blöcke
- Leicht anpassbare Tastaturbelegung
- Makro-Recorder
- Mehrfach-Undo und -Redo
- Plug-in-Schnittstelle für Funktionserweiterungen
- Themes für die Farbwahl und Auszeichnung
Im Programm ist eine ausführliche Hilfe mit kleinem, englischem Tutorial eingebaut, die per Strg+G zu erreichen ist und gut erklärt, wie man Tasten umbelegen kann. Es gibt etwa dreißig offizielle Plug-ins, von denen einige schon von Haus aus vorinstalliert sind. Plug-ins lassen sich in der Sprache Lua schreiben, der notwendige Interpreter ist in Micro eingebaut. Auch hier bietet die eingebaute Hilfe Unterstützung an.
Fazit
Das neue Edit von Microsoft ist mehr ein Marketing-Gag als ein ernst zu nehmender Editor. Die Versionsnummer sollte eher 0.1 statt 1.1.0 lauten. Statt ein weiteres Open-Source-Tool zu kreieren, das so gut wie nichts kann, wäre es besser gewesen, eine ausgereifte Open-Source-Anwendung wie Micro einfach in Windows 10 und 11 aufzunehmen. Aber hey: Micro ist ja nur einen Aufruf entfernt. Ausprobieren lohnt sich auf alle Fälle.
(who)
Künstliche Intelligenz
Katzen betreuen aus der Ferne: Von Catcam bis Futterautomat
Katzen mit in den Urlaub zu nehmen, ist nahezu ausgeschlossen – das gilt jedenfalls für unsere zwei Fellnasen. Nicht nur die Reisezeit im engen Katzentransporter bedeutet Stress für die beiden, auch die fremde Umgebung benötigt Gewöhnung. Doch was tun, wenn die Besitzer mal eine Auszeit brauchen und die Katzen alleine zu Hause sind?
Zugegeben, früher konnte ich problemlos die Katzen alleine lassen, sofern einmal am Tag jemand nach dem Rechten sieht. Ich war derjenige, der meine Frau beruhigte, dass alles in Ordnung sei. Doch immer häufiger meldete sich das eigene schlechte Gewissen und fragte sich, ob es den beiden Miezen wirklich an nichts mangelt. Da traf es sich gut, dass die Security-Kamera sich auch wunderbar als Katzen-Cam nutzen ließ. Doch das war nur der Anfang …
- Bei angemessener Versorgung können Katzen ein paar Tage alleine sein.
- Security-Kamera helfen dabei, nach dem Rechten zu sehen.
- Futterautomaten und Trinkbrunnen überbrücken die Zeit bis zum Katzensitter.
Um das eigene Gewissen zu beruhigen, will ich selbst nicht nur nach dem Rechten sehen können. Es soll den Katzen möglichst an nichts fehlen, weder an Futter, noch Wasser und Beschäftigung. Der Markt bietet für Katzenbesitzer zum Glück eine Vielzahl an Möglichkeiten, damit die Tiere auch dann umsorgt sind, wenn man physisch nicht anwesend ist. So lässt sich die Versorgung mit Futter und Wasser automatisieren und aus der Ferne überwachen. Sogar die Toilette kann sich inzwischen selbst reinigen.
Das war die Leseprobe unseres heise-Plus-Artikels „Katzen betreuen aus der Ferne: Von Catcam bis Futterautomat“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.
Künstliche Intelligenz
Lehrerverband gegen Altersgrenze für Tiktok, Insta und Co.
Der Deutsche Lehrerverband spricht sich gegen eine Altersgrenze für die Nutzung sozialer Medien aus. Verbandspräsident Stefan Düll nannte die Idee einer gesetzlichen Altersbegrenzung „realitätsfern und auch nicht sinnvoll“. Zwar sei der Wunsch, Kinder zu schützen, verständlich, sagte er der „Stuttgarter Zeitung“ und den „Stuttgarter Nachrichten“ (Mittwoch). „Aber Facebook, Instagram und Tiktok sind Teil einer Realität, in der junge Menschen lernen müssen, sich zurechtzufinden. Verbote helfen da nicht weiter“, sagte Düll.
Zuletzt hatte sich etwa Bundesjustizministerin Stefanie Hubig (SPD) für eine Altersgrenze für soziale Medien ausgesprochen. CDU, CSU und SPD hatten im Koalitionsvertrag vereinbart, den Kinder- und Jugendschutz in der digitalen Welt zu stärken. Schleswig-Holsteins Ministerpräsident Daniel Günther (CDU) hatte ein Verbot sozialer Medien für unter 16-Jährige gefordert.
Mögliche Verbote und Altersgrenzen hält Lehrerverbandspräsident Düll für kaum umsetzbar. Stattdessen komme es darauf an, Kinder zu einem klugen Umgang mit dem Internet zu erziehen. Hier seien Eltern und die Schulen gefordert. Kinder und Jugendliche hätten zudem ein Recht auf Information. „Es kann uns gefallen oder nicht: Aber wenn sie sich zum Beispiel über Politik informieren, geschieht das oft über Social Media“, sagte Düll.
(dmk)
-
Online Marketing & SEOvor 6 Tagen
Aus Marketing, Medien, Agenturen & Tech: Diese 40 klugen Köpfe unter 40 müssen Sie kennen
-
Digital Business & Startupsvor 5 Tagen
Von Peter Thiel finanziertes Krypto-Startup Bullish will an die Börse
-
Künstliche Intelligenzvor 6 Tagen
Amazon soll Werbung bei Prime Video verdoppelt haben
-
Social Mediavor 3 Tagen
LinkedIn Feature-Update 2025: Aktuelle Neuigkeiten
-
Online Marketing & SEOvor 5 Tagen
Influencer Marketing: Warum Influencer Vertrauen verlieren und klassische Medien gewinnen
-
Apps & Mobile Entwicklungvor 3 Tagen
So gut ist Dune: Awakening: Dune sehen und durch Sandwürmer sterben
-
UX/UI & Webdesignvor 5 Tagen
Wie gelingt eine einwandfreie Zusammenarbeit?
-
Datenschutz & Sicherheitvor 6 Tagen
CCC: Gesammelte Ausweisdaten von Übernachtungsdienstleister Numa gefunden