Apps & Mobile Entwicklung

Nach Nvidia, Meta & Co: Auch AMD bewirbt nun das 1:1-CPU-GPU-Verhältnis für AI

AMD springt medial auf den Zug auf, in dem das 1:1-CPU-GPU-Verhältnis bei AI übernimmt. Für AMD zahlt sich das natürlich richtig aus, denn schließlich ist man einer der größten CPU-Anbieter und freut sich über weitere Aufträge für Epyc. Doch was ist das 1:1-Verhältnis eigentlich?

Bisher: Eine CPU, vier GPUs

In den letzten Jahren war der Standard in modernen Servern mit GPU-Beschleunigung und damit auch den ersten AI-Servern in der Regel ein oder zwei Prozessoren, die bis zu acht GPUs unterstützen, im Schnitt also ein Verhältnis von 1:4 aus CPU-Perspektive.

Bereits in den letzten beiden Jahren Jahre hat aber beispielsweise Nvidias GB200 gezeigt, dass das Verhältnis von 1:2 ein durchaus gutes ist, wenn die Aufgabenvielfalt oder Priorität eine andere wird. GB200 besteht in der Basis aus einer Platine, zwei B200-GPUs werden von einer Grace-CPU unterstützt. Das ganze wird dann wiederum doppelt gepackt in ein Rack gesteckt, fertig ist NVL72.

Meta Catalina vs. Nvidia NVL72 mit GB200 (Bild: Hot Chips 2025)

Meta baute bereits GB200 aus 1 × CPU + 1 × GPU

Bereits im letzten Jahr erklärte Meta zur Hot Chips 2025, dass das Unternehmen die Basis von GB200 nehme, daraus aber eine Lösung bastle, die nur eine GPU an eine CPU binde. Nvidia hatte zuvor im Oktober 2024 die gesamte GB200-Plattform für das Open Compute Project (OCP) zugänglich gemacht, 2025 folgte bereits die Übergabe für Vera Rubin. Entsprechend angepasste Lösungen können nun auch daraus gebaut werden.

Dass CPUs längst wieder wichtiger geworden sind, zeigen nicht nur Ausverkäufe bei AMD und Intel im letzten Quartal. Nvidia hatte zu seiner Hausmesse Nvidia GTC 2026 im März schon das neue Komplettprogramm rund um die neue Vera-CPU dabei: ein eigenes Rack nur mit 256 Nvidia-Server-CPUs – das gab es noch nie zuvor. Partner wie HPE bauten das sogar noch aus, zeigten bereits Racks mit 640 Vera-Prozessoren.

Der Tenor aller ist klar: Die CPU ist wieder wichtig. So richtig weg war sie aber letztlich auch nie, was die Anstrengungen von Amazon & Co mit eigenen Arm-Prozessoren zeigten. Es gab und gibt schon immer einen Markt auch für CPUs, nun rücken sie allerdings voll ins Rampenlicht des AI-Umfelds. Das wiederum könnte dann durchaus Folgen für die nächsten Jahre haben, denn sich mit hunderttausenden GPUs einzudecken zieht dann und für parallele neue Aufgaben auch eine große Menge CPUs nach sich. Und natürlich Speicher; aber der ist ohnehin schon teure Mangelware.

AI entwickelt sich zu neuen Anforderungen an die Hardware (Bild: AMD)

AMD: 1:1 Ja, aber auch erst einmal 1:4

AMD erklärt hier vermutlich nicht ganz uneigennützig, dass CPUs in gewissem Umfeld sogar mehr als GPUs zu finden sein könnten. Passende Racks mit Venice wird man in Zukunft vermutlich mit Partnern anbieten. Das große AMD-Prestige-Projekt dieses Jahres, das Helios-Rack, wiederum setzt ganz auf das klassische 1:4-Format: Eine Venice-CPU und vier Instinct MI455X. Das macht aber nur noch einmal deutlicher: One Size fits all existiert nicht.

Source link

Verwandte Themen:11CPUGPUVerhältnis amd auch bewirbt das Fur meta nach nun Nvidia

Up Next

Instagram: Meta setzt Ende-zu-Ende-Verschlüsselung ein Ende

Nicht verpassen

Im Test vor 15 Jahren: Intels Core i3-2100T sparte Strom und Leistung

Apps & Mobile Entwicklung

Supercomputer mit 2 ExaFLOPS: China feiert furioses Comeback in den Top500

Schon lange hatte China kein neues System mehr in der Supercomputer-Weltrangliste Top500 platziert. Doch jetzt gibt es ein furioses Comeback, denn LineShine am National Supercomputing Centre in Shenzhen (NSCS) stürmt mit mehr als 2 ExaFLOPS direkt an die Spitze. Statt GPU-Power gibt es mehr als 45.000 CPUs vom Typ LX2.

LineShine aus China ist die neue Nummer 1

In der jüngsten Ausgabe der Top500 der schnellsten Supercomputer mit Stand Juni 2026 gibt es einen Thronwechsel. Das US-System El Capitan ist mit rund 1,8 ExaFLOPS nicht mehr schnell genug für die Spitze, da es der Neueinsteiger LineShine aus China auf ganze 2,2 ExaFLOPS bringt. Genau genommen liegt die im Linpack-Benchmark gemessene Spitzenleistung (Rmax) bei 2198,40 PetaFLOPS. Damit steht China nach genau zehn Jahren wieder an der Spitze: Im Juni 2016 war dies zuletzt dem System Sunway TaihuLight mit 93 PetaFLOPS gelungen.

Preisverleihung für die neue Nummer 1 der Top500

Nur CPUs, keine GPUs

Die enorme Rechenleistung bezieht Chinas schnellster Supercomputer nicht aus GPU-basierten Rechenbeschleunigern – schließlich herrscht auch weiterhin ein Exportverbot für GPUs der US-Hersteller AMD und Nvidia nach China. Stattdessen nimmt man sich praktisch den japanischen Dauerbrenner Fugaku als Vorbild und setzt auf eine schiere Masse an CPUs. Dabei handelt es sich um den Typ LX2, der auf der Arm-v9-Architektur basiert und angeblich von Huawei entwickelt wurde.

Jeder der LX2-Prozessoren kommt auf 304 CPU-Kerne. Da laut Ranglisteneintrag insgesamt 13.789.440 Kerne vorhanden sind, würde das umgerechnet den Einsatz von 45.360 Prozessoren bedeuten. Allerdings war im Vorfeld von sogar rund 47.000 CPUs die Rede, die sich auf 92 Server-Schränke verteilen. Weitere Eckdaten liefert ein Bericht von HPC Wire aus dem April.

Die Top10 der schnellsten Supercomputer laut Top500.org

Italien legt noch etwas drauf

Ein weiterer Neuzugang in den Top10 ist HPC7 aus Italien, das mit 571,5 PetaFLOPS noch etwas schneller als das Schwestersystem HPC6 rechnet. Beide gehören zum römischen Energiekonzern Eni. HPC7 steigt direkt auf Platz 6 ein, verdrängt damit das US-System Eagle und steht hinter dem schnellsten Supercomputer Europas (Jupiter aus Deutschland).

Durch die Neuzugänge mussten wiederum zwei Systeme die Top10 verlassen. Das ist zum einen LUMI aus Finnland sowie Leonardo aus Italien.

Nationen

Erneut stellen die USA die meisten Systeme, doch sank die Zahl gegenüber der letzten Rangliste aus dem November 2025 um zehn. Dank dem neuen 2-ExaFLOPS-System bietet China die zweithöchste kombinierte Rechenleistung, liegt bei der Anzahl mit nur noch 30 Systemen, aber nur auf Rang vier. Davor liegen Deutschland und Japan, während Frankreich erneut den fünften Platz belegt.

Länder mit den meisten Systemen

AMD, Intel und Nvidia

Bei den Hauptprozessoren (CPU) ist der Hersteller Intel weiterhin am häufigsten vertreten. Allerdings setzt sich der Abwärtstrend weiter fort, sodass statt zuletzt noch 57 Prozent nur noch 53 Prozent der Systeme Intel-CPUs nutzen. Im Gegenzug legte AMD erneut zu: Statt 35,6 Prozent im vergangenen November sind es jetzt 38,4 Prozent. Andere Hersteller inklusive Nvidia, Fujitsu und IBM bringen es dementsprechend zusammen auf einen Anteil von 8,6 Prozent, das sind 1,2 Prozentpunkte mehr als vor gut einem halben Jahr.

Der Anteil von Systemen mit Co-Prozessoren (meist GPUs) steigt kontinuierlich, sodass nun mit 277 Systemen 55,4 Prozent der Supercomputer eine solche Architektur nutzen. Mehr als ein Fünftel davon setzen auf Nvidia Hopper und 62 auf Nvidia Ampere. Die Zahl der Systeme mit AMD Instinct steigt leicht von 29 auf nun 32. GPUs aus dem Hause Intel sind bei 4 Systemen zu finden.

Green500

Die nach Rechenleistung pro Watt geordnete Effizienzrangliste Green500 wurde ebenfalls aktualisiert und wird in einem zweiten Artikel auf ComputerBase separat behandelt.

Green500: Bei den effizientesten Supercomputern liegt Europa ganz vorn

ComputerBase hat Informationen zu diesem Artikel von Top500.org unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.

Source link

Apps & Mobile Entwicklung

Epyc Venice zur ISC 2026: AMDs neue Server-CPU mit 16-Kanal-Speicher inkognito bereits zu sehen

Der Start wird in genau einem Monat erfolgen, doch die ISC 2026 greift wieder etwas voraus. An einigen Ständen sind Systeme mit neuem Epyc-Prozessor, Codename Venice, bereits zu sehen. Dabei dürfen die Partner PCI Express 6.0 und auch 16-Kanal-Speicher schon aktiv bewerben, Fotos vom Sockel sind aber nicht gern gesehen.

Einige Partner sind durchaus bereits sehr offensiv beim Bewerben der kommenden Produkte unterwegs. Die Serversparte von MSI beispielsweise führt direkt mehrere Server und Blades in verschiedenen Formen und mit darauf angepasster Ausstattung zur ISC 2026 vor.

Direkt sichtbar wird natürlich als erstes die Bestückung mit 32 Speicherbänken für zwei Sockel, das bedeutet 16 DIMMs pro Prozessor als 1DPC-Lösung, also ein DIMM pro Channel. Diese Ausstattung für Venice gilt bereits seit einiger Zeit als gesetzt. Die in der Mitte liegenden CPU-Sockel wurden behelfsmäßig abgedeckt – Fotos verboten!

AMD-Server mit neuen CPUs, mehr Speicher und PCIe 6.0

Die Typenschilder zu den Systemen verraten dann ein wenig mehr über die breite Nutzung von PCI Express 6.0 für alle Bereiche, sei es von den Erweiterungsslots in dem einen System und dabei auch für Netzwerklösungen gedachte bis hin zum Massenspeicher ist hier durchaus Vielfalt dabei. Ganz klassische Dinge wie ein kleiner Grafikchip onboard und auch ein kleiner LAN-Anschluss für schnellen lokalen Management-Zugriff runden dann die jeweiligen Systeme ab.

An AMDs eigenem Stand, auf der ISC 2026 ganz prominent direkt im Eingangsbereich, steht erneut ein Produkt im Mittelpunkt: Helios. Das erste eigene Rackscale-Design wird in einem Monat auf der AMD Advancing AI 2026 offiziell in den Dienst gestellt. Mit dabei ist dann auch AMD Epyc Venice mit neuer Zen-6-Architektur und bis zu 256 Kerne sowie die Instinct-MI400-Serie in Form verschiedener Ausführungen. Ausgestellt am Stand haben sie diese vor Ort nicht, nur die bisherigen Modelle sind da zu sehen. Das war im letzten Jahr noch anders: Instinct MI350 wurde faktisch zwei Tage vor AMDs Event in Hamburg komplett durch ComputerBase geleaked.

An AMDs Stand ist Helios erneut das Aushängeschild

Source link

Apps & Mobile Entwicklung

LineShine im Detail: Chinas Nummer-1-System ist ein wahres Monster

Eine CPU mit 304 Kernen, skaliert über 10.000e Nodes – heraus kommt LineShine aus China, der schnellste Supercomputer der Welt. Im Rahmen der ISC 2026 gab der Erstplatzierte einige weitere Details zu dem System und seinem Aufbau, der massiv auf Chiplets, HBM und viele Raffinessen setzt.

Die Präsentation glänzte dabei auch mit mehr als subtilen Understatements: „Man hatte einige Probleme zu überkommen, wie sie sich vorstellen können“, betonte Yutong Lu als Chief Designer des LineShine-Supercomputers und Director des National Supercomputer Center in Shenzhen. Schon im April offiziell enthüllt, lief das System aber dann doch eher unter dem Radar, um heute mit großem Knall seinen Auftritt zu haben. Fertig gebaut war es dabei schon im letzten Jahr, erklärte Lu auf der Bühne. In Betrieb ist es seit Beginn dieses Jahres.

13.789.440 Kerne sind im Supercomputer verbaut. Ein einzelner Prozessor, genannt LX2, basierend auf der Armv9-ISA inklusive SME und SVE, setzt dabei auf zwei Chiplets mit je 152 Kernen bei vergleichsweise geringem Takt von 1,55 GHz, flankiert von gleich vier I/O-Dies und acht HBM-Chips auf dem gleichen Package. Die acht HBM-Chips bieten insgesamt 32 GByte mit einer Bandbreite von 4 TByte pro Sekunde, es klingt nach einer Lösung auf Basis von HBM2e – einen Hersteller dafür nennt man natürlich nicht. Hier könnte eine Eigenentwicklung genutzt werden, da 4 GByte pro einzelnem HBM-Stapel doch vergleichsweise sehr gering sind.

Der HBM im Prozessor kann dabei im Flat oder Cache Mode eingesetzt werden – das Verhalten ist vom 2022 eingeführten Intel Xeon Max alias Sapphire Rapids mit HBM bekannt. Parallel dazu gibt es aber auch noch Off-Package-DRAM, von 128 GByte pro CPU-Chiplet in vier NUMA-Domains ist hier die Rede.

Ein Supercomputer lebt aber vor allem von der Skalierung. Ein angepasstes Interconnect, optische Verbindungen und mehr sind deshalb ebenso dabei wie darauf angepasste Software. Und all das ist am Ende auch komplett flüssiggekühlt – auch hier hat sich Chinas neue Nummer 1 viel von westlichen Lösungen abgeschaut. Dort geht in Zukunft in diesem Bereich auch absolut nichts mehr ohne Flüssigkeitskühlung.

Der Bilderpool liefert einige Impressionen aus dem vor Ort gezeigten Video und der Präsentation des Systems.

Inwiefern Huawei als bekanntester und größter Hersteller und Ausrüster solcher Systeme darin involviert ist, wollte man nicht offiziell bekannt geben. Auch auf Nachfrage am Stand auf der ISC 2026 gab es dazu keine echte Antwort. Blumig gab man jedoch unter der Hand zu verstehen, dass Huawei „irgendwo“ aber bestimmt involviert war.

Ein Supercomputer nur aus CPUs ist dabei natürlich nicht so effizient wie GPU-basierte Lösungen, aber auch nicht so schlecht, wie vielleicht erwartet oder gedacht. 42,22 Megawatt sind zweifelsohne eine hohe Zahl, aber zum Vergleich: Der auf Intel-Technik basierende Aurora braucht für 1 ExaFLOP mit CPUs und GPUs 38,7 Megawatt. LineShine kommt mit über 2 EF so auf 52,07 Gigaflops/Watt, das reicht damit sogar für Platz 50 in der Green500-Liste. Dabei hilft die deutlich effizientere Ausnutzung der Hardware, El Capitan ist auf dem Papier theoretisch zu mehr fähig, liegt am Ende in der Praxis aber zurück.