Connect with us

Apps & Mobile Entwicklung

CPUs bleiben wichtig: Nvidia bietet reines Vera-CPU-Rack mit 256 Prozessoren an


Agentic AI und Reinforcement Learning benötigen schnelle CPUs, erklärt Nvidia zur GTC. Deshalb bietet das Unternehmen seine neue Vera-CPU jetzt auch in einem Rack ausschließlich mit CPUs an. Es reiht sich damit neben der Vera-Rubin- und der neuen LPU/LPX-Lösung ein. Partner gehen dabei noch weiter als Nvidia selbst mit 256 CPUs.

Vera hat 88 Custom-Arm-Kerne mit SMT für 176 Threads

Vera ist Nvidias neue Custom-Arm-CPU und bildet den CPU-Teil der neuen Vera-Rubin-Plattform, die in der zweiten Jahreshälfte 2026 an den Start gehen soll. Nvidia hatte Vera erstmals zur Computex 2024 benannt, zudem sind seit der letztjährigen GTC erste technische Details bekannt. Vera bietet 88 Custom-Arm-Kerne mit SMT für 176 Threads und wird mittels NVLink-C2C-Interconnect mit 1,8 TB/s an Rubin angebunden.

Zur diesjährigen GTC zeigt Nvidia die Vera-CPU allerdings auch als Einzellösung im Rack – ohne Rubin-GPU. Datacenter-Installationen lassen sich damit um mehr Prozessoren erweitern, als sie die Vera-Rubin-Plattform in der CPU-GPU-Kombination alleine mitbringt. Zur Erinnerung: Im „Oberon“ getauften Rack von Vera Rubin (VR NVL72) kommen 18 Compute Trays mit jeweils zwei Boards zum Einsatz, wobei auf jedem Board zwei Rubin-GPUs und eine Vera-CPU verbaut sind, also vier GPUs und zwei CPUs pro Tray für insgesamt 72 GPUs (mit 144 Dies) und 36 CPUs pro Rack.

Warum schnelle CPUs auch bei KI wichtig sind

Schnelle CPUs können im Zeitalter von Agentic AI und Reinforcement Learning von hoher Bedeutung im KI-Rechenzentrum sein. Reinforcement Learning ist ein Verfahren aus dem Machine Learning, bei dem ein KI-System durch Ausprobieren und Feedback lernt. Ein Agent führt Aktionen in einer Umgebung aus und erhält dafür Belohnungen oder Strafen. Durch viele Wiederholungen lernt das System, welche Entscheidungen langfristig die beste Belohnung bringen, und verbessert so schrittweise seine Strategie.

CPUs bleiben im KI-Zeitalter von Bedeutung
CPUs bleiben im KI-Zeitalter von Bedeutung (Bild: Nvidia)

Nvidia sieht eine Architektur für das Reinforcement-Learning-Training von KI-Agenten vor, bei der GPUs und CPUs unterschiedliche Aufgaben übernehmen. Ein großer GPU-Cluster führt das Training und Inference des Modells durch. Das Modell erzeugt dabei Tokens – z. B. Code, Befehle oder Abfragen. Eine Sandbox-Infrastruktur mit CPU-Kernen führt diese erzeugten Tokens tatsächlich aus, z. B. SQL-Abfragen, Code kompilieren, Python-Programme laufen lassen. Die CPUs liefern die Ergebnisse und Daten zurück, die als Bewertung (Evaluation/Reward) für das Training dienen. Damit wird Reinforcement Learning umgesetzt: Das Modell probiert Aktionen aus (Code schreiben), sieht das Ergebnis der Ausführung und lernt daraus, bessere Lösungen zu erzeugen.

Olympus-Kern mit „world-class“ Single-Thread-Leistung

Zur GTC hat sich Nvidia erstmals auch zur Mikroarchitektur von Vera geäußert und dabei erklärt, was die Custom-Arm-Kerne auszeichnet. Die eigens entwickelten Kerne laufen demnach unter der Bezeichnung „Olympus“ und sollen eine „world-class“ Single-Thread-Leistung erreichen. Vera biete die 1,5-fache IPC von Grace, erklärte Nvidia in San Jose zur Hausmesse für KI-Entwickler.

Olympus bietet ein „10-wide instruction decode“, kann demnach bis zu 10 Instruktionen pro Takt dekodieren und an die Ausführungseinheiten weiterreichen. Die Mikroarchitektur bietet einen Neural Branch Predictor, also eine neue Art der Sprungvorhersage, bei der ein kleines neuronales Modell verwendet wird, das Muster in früheren Programmverläufen erkennt und dadurch oft genauere Vorhersagen trifft als klassische Tabellen- oder Heuristik-basierte Verfahren. Dadurch werden Pipeline-Stalls im Idealfall reduziert und die CPU kann effizienter arbeiten. Zwei Sprungvorhersage pro Taktzyklus sind bei Olympus möglich. Außerdem kommt bei der CPU ein für PyTorch optimierter Instruction-Buffer zum Einsatz.

Vera-CPU mit 88 Olympus-Kernen
Vera-CPU mit 88 Olympus-Kernen (Bild: Nvidia)

Mehr Speicherbandbreite als x86-Prozessoren

Eine weitere Eigenschaften von Vera ist die laut Nvidia dreifache Speicherbandbreite pro Kern im Vergleich zu – namentlich nicht genannten – x86-Prozessoren. Das Unternehmen gibt insgesamt 1,2 TB/s für die 1,5 TB SOCAMM-LPDDR5X an, die jeder CPU zur Seite stehen. Pro Kern ist von bis zu 80 GB/s die Rede. Die CPUs bieten einen NVLink GPU Connect mit 1,8 TB/s sowie einen CPU-Chip-zu-Chip-Support für 2P-Lösungen.

Vera-CPU-Rack mit 256 Prozessoren

Nvidia selbst zeigt zur GTC ein neues Vera-CPU-only-Rack mit insgesamt 256 Vera-CPUs (22.528 Kerne mit 45.056 Threads), 400 TB SOCAMM-LPDDR5X für insgesamt 300 TB/s und 64 BlueField-4 DPUs. Vera-Racks setzen auf dieselbe MGX-Architektur zur Flüssigkeitskühlung wie die Vera-Rubin-Plattform.

Die Partner gehen noch weiter

Vera sei in voller Produktion, sagt Nvidia, und soll im Laufe des zweiten Halbjahres 2026 von zahlreichen namhaften Server-Partnern verfügbar sein. Einer davon ist HPE, der mit seinem GX5000 Rack weit über die Lösung von Nvidia hinausgeht. Bis zu 40 Blades mit jeweils 8 Nodes mit jeweils 2 Vera-CPUs (16 CPUs pro Blade) sind bei HPE möglich, sodass in einem Rack bis zu 640 CPUs mit 56.320 Olympus-Kernen zum Einsatz kommen.

Nvidia Vera CPU Rack
Nvidia Vera CPU Rack (Bild: Nvidia)

ComputerBase hat Informationen zu diesem Artikel von Nvidia unter NDA im Vorfeld und im Rahmen einer Veranstaltung des Herstellers in San Jose, Kalifornien erhalten. Die Kosten für An-, Abreise und fünf Hotelübernachtungen wurden vom Unternehmen getragen. Eine Einflussnahme des Herstellers oder eine Verpflichtung zur Berichterstattung bestand nicht. Die einzige Vorgabe aus dem NDA war der frühestmögliche Veröffentlichungszeitpunkt.



Source link

Apps & Mobile Entwicklung

Raptor Lake Refresh Refresh: Intel bringt neue SKUs der 10-nm-CPU als Core 200 auch 2027


Raptor Lake Refresh Refresh: Intel bringt neue SKUs der 10-nm-CPU als Core 200 auch 2027

Bild: Intel

Eine neue Auflage von Raptor Lake kommt auch 2027 noch einmal. Der Status von Intels 10-nm-CPU nähert sich nun langsam altbekanntem an, wenngleich die Vorzeichen etwas anders sind. Doch rein auf das Alter gesehen haben 10-nm-CPUs von Intel im Jahr 2027 auch schon acht Jahre auf dem Buckel – 14++++ lässt grüßen.

Intels LGA-1700-Familie soll auch 2027 noch einmal Nachwuchs erhalten. Damit bleibt auch eine DDR4-Plattform bei Intel weiter im Spiel – dies dürfte schon einer der Gründe sein, warum Raptor Lake als Refresh Refresh sogar in Form neuer Modellvarianten hier weiterleben und das Erbe von Intel Alder Lake weiterführen soll. Als Name wird dann jedoch nicht mehr Core i-13000/14000 genutzt, sondern Core 200 – so passt sich das Schema der aktuellen modernen Palette an und verdeutlicht dabei auch direkt, dass es eben keine Neuheiten per se sind. Denn 2027 steht ganz oben ein Intel Core Ultra 400.

Wie die Gerüchte verdeutlichen, werden die CPUs im Herzen das gleiche Silizium wie die im Jahr 2022 vorgestellten nutzen. Und so gibt es auch kein neues Stepping oder neue Features, allerdings wie die Kern-Auswahl und Cache-Bestückung leicht auf den 2027 anvisierten Einsteigermarkt abgestimmt.

Die Produkte sind so letztlich keine echten Nachfolger für bisherige Raptor Lakes, außer Kunden kommen von einem 12100F oder 13100F und wollen „günstig“ in dieser Plattform noch einmal aufrüsten.

Auch AMD bringt alte CPUs (zurück)

Diese Idee ist aktuell groß in Mode, AMD bestückt so ebenfalls den Sockel AM4 noch einmal mit dem AMD Ryzen 7 5800X3D für viel Geld, bringt zudem kleine Gaming-Lösungen mit acht älteren Kernen auch neu in den Sockel AM5: der AMD Ryzen 7 7700X3D. AMDs AM4-CPU ist dabei im Kern sogar noch älter als Intels Angebot: Zen 3 wurde bereits vor sechs Jahren in TSMCs N7-Prozess eingeführt, lebt so also auch schon über eine halbe Dekade.

Im Notebook-Markt garniert AMD die Neuvorstellungen mit beispielsweise einem AMD Ryzen 5 3501U – Launch-Datum Q2/2026 mit Picasso-Architektur, das ist Zen+ mit DDR4-2400!

Langlebige Nodes sind auch Intels „Spezialität“

Intels 10-nm-Fertigung, im Marketing Intel 7 genannt, lebt damit deutlich länger weiter, als einmal erwartet. Der Grund hierfür ist aber einfach: Er funktioniert ganz ohne EUV, die älteren Fabriken von Intel produzieren ihn am Fließband und die Produkte sind zuletzt sogar ausverkauft gewesen, während sich die EUV-Fabs auf neue Produkte mit höherer Gewinnmarge konzentrieren. Damit rückt Intels 10-nm-Fertigung langsam in zeitliche Regionen vor, in der 14 nm aktiv war.

Fünf Generationen an 14-nm-Produkten
Fünf Generationen an 14-nm-Produkten (Bild: Intel)

Die 14-nm-Fertigung bei Intel war legendär und gleichzeitig auch berüchtigt, weil sie schlichtweg über ein halbes Jahrzehnt mangels Alternativen genutzt werden musste – Start war bereits 2014 mit Broadwell. Denn Intels erster Versuch bei 10 nm lief völlig schief, das Unternehmen versuchte EUV zu umgehen und diverse Neuerungen gleichzeitig einzuführen und scheiterte dabei krachend. Die CPU-Architekturen Skylake, Kaby Lake, Coffee Lake, Coffee Lake Refresh und Comet Lake basierten auf den gleichen Kernen, unterschieden sich am Ende zum Großteil nur in ihrer Anzahl und im Takt – 14++++ war geboren.

Fünf Generationen an 14-nm-Produkten
Fünf Generationen an 14-nm-Produkten (Bild: Intel)

2021 kam dann auch noch Rocket Lake in 14 nm, weil die erste Generation der 10-nm-Fertigung nicht hoch takten konnte. Erst mit 10+(+) wurde dies deutlich besser – und das Marketing übernahm und machte daraus Intel 7 und andere Bezeichnungen.

SuperFin und Enhanced SuperFin
SuperFin und Enhanced SuperFin (Bild: Intel)



Source link

Weiterlesen

Apps & Mobile Entwicklung

Galaxy Z Fold 8 Wide: Dickeres Glas soll für weniger Knitterfalten sorgen


Samsung plant für Ende Juli die Vorstellung drei neuer faltbarer Smartphones: Galaxy Z Flip 8, Galaxy Z Fold 8 (Wide) und Galaxy Z Fold 8 Ultra. Für den Neuzugang im Breitbildformat sei ein neues „Ultra Thin Glass“ vorgesehen, das diesmal aber dicker ausfalle, um potenziellen Knitterfalten im Bereich des Scharniers vorzubeugen.

Das berichtet ZDNet Korea unter Verweis auf Lieferketten des Smartphone-Herstellers. Dass Samsung zum nächsten Unpacked-Event am 22. Juli Apple mit einem Foldable im Breitbildformat zuvorkommen will, kursiert spätestens seit der Veröffentlichung erster Renderings im Frühjahr durch die Gerüchteküche. Bei Samsung soll das Wide-Modell schlichtweg Galaxy Z Fold 8 heißen, während der Nachfolger des Foldables im Format des vorherigen Galaxy Z Fold 7 (Test) als Galaxy Z Fold 8 Ultra vorgestellt werden soll.

UTG im Fold Wide geht auf 60 μm

Für diese breitere Variante plane Samsung den Einsatz eines Ultra Thin Glass (UTG), das 60 μm dick sein und damit das UTG des Galaxy Z Fold 7 um 33 Prozent übersteigen soll. Das Galaxy Z Fold 8 Ultra bleibe hingegen bei den 45 μm des Vorgängers. Beim Galaxy Z Fold 6 sei das UTG noch 30 μm dünn gewesen. Das Galaxy Z Flip 7 komme auf 50 μm, berichtet ZDNet Korea, Angaben zum Nachfolger macht die Seite nicht.

Dickeres Glas soll Falz verschleiern

Die dickere Glasschicht soll dafür sorgen, dass sich im Bereich des Scharniers und der Falz keine Knitterfalten schon ab Werk respektive später im Alttag durch den wiederholten Faltprozess entwickeln. Den Falz praktisch unsichtbar zu machen, wird von zahlreichen Smartphone-Herstellern angestrebt. Aus Sicht der Redaktion kommt das Oppo Find N6 (Test) diesem Bestreben derzeit am nächsten.

Glas stammt aus den USA und Deutschland

Dickeres Glas kaschiert den Falz und schützt das OLED-Panel potenziell besser, es verhält sich im Alltag aber weniger flexibel und kann früher brechen. Samsung scheint mit dem bevorstehenden Wide-Foldable aber einen guten Kompromiss beider Eigenschaften gefunden zu haben. Das Glassubstrat für das UTG stammt von Corning und Schott, die Weiterverarbeitung erfolgt beim Flip durch Iconi, UTI und Samsung Electronics, während beim Fold das koreanische Unternehmen Dowinsys verantwortlich ist. Die OLED-Panels wiederum stammen bei allen Modellen von Samsung Display.



Source link

Weiterlesen

Apps & Mobile Entwicklung

Intel Core Ultra 7 251HX: Neue Notebook-Gaming-CPU ist im PassMark richtig flott


Intel Core Ultra 7 251HX: Neue Notebook-Gaming-CPU ist im PassMark richtig flott

Bild: Intel

Der Intel Core Ultra 7 251HX ist erstmals mit zwei Einträgen im PassMark-Benchmark aufgetaucht. Dabei schlägt der 18-Kerner sogar andere Core-Ultra-7-CPUs mit 20 Kernen, allerdings nur mit knappem Abstand. Zudem muss beachtet werden, dass diese Ergebnisse noch als vorläufig zu werten sind.

Mit dem Core Ultra 7 251HX bietet Intel einen weiteren Mobile-Prozessor für Gaming-Laptops an. Die CPU basiert auf der Arrow-Lake-Architektur und bietet insgesamt 18 Kerne, davon 6 Performance-Cores und 12-Effizienz-Kerne. Gegenüber den 20-Kernern Core Ultra 7 255HX und Core Ultra 7 265HX erreicht der Core Ultra 7 251HX gemäß zwei PassMark-Einträgen leicht höhere Single- und Multi-Thread-Werte.

Die PassMark-Werte im Detail

Konkret erreicht der Intel Core Ultra 7 251HX einen Single-Thread-Wert von 4.666 Punkten und einen Multi-Thread-Wert von 48.713 Punkten. Demgegenüber fällt der 255HX mit 4.573 Punkten (Single-Thread) und 48.612 Punkten (Multi-Thread) im Vergleich leicht ab. Auch der 265HX erreicht mit 4.546 Punkten im Single-Thread-Benchmark und 48.536 Punkten als Multi-Thread-Wert nicht ganz das Niveau des 251HX, obwohl dieser zwei Performance-Kerne weniger besitzt.

Dabei liegt der Basistakt des Intel Core Ultra 7 251HX mit 2,9 GHz allerdings über dem Basistakt des 255HX mit 2,4 GHz und dem 265HX mit 2,6 GHz. Dafür muss sich der 251HX mit bis zu 5,1 GHz Turbotakt gegenüber dem 255HX und 265HX mit 5,2 respektive 5,3 GHz geschlagen geben.

Es lohnt sich zudem ein Vergleich mit dem 14-Kerner Core Ultra 5 245HX, der wie der 251HX sechs Performance-Kerne hat, aber 4 Effizienz-Kerne weniger bietet (8 E-Cores statt 12). Wenig überraschend muss sich der 245HX daher gegenüber dem 251HX im Passmark klar geschlagen geben. Demnach erreicht der 245HX einen Single-Thread-Wert von 4.483 Punkten (-3,9 Prozent im Vergleich mit dem 251HX) und einen Multi-Thread-Score von 37.945 Punkten (-22,1 Prozent).

Werte des Core Ultra 7 251HX noch vorläufig

Aufgrund der Tatsache, dass bislang lediglich zwei Messwerte des Intel Core Ultra 7 251HX vorliegen, sind die PassMark-Ergebnisse dieser Mobile-CPU noch als vorläufig zu werten. Denn für die anderen im Vergleich herangezogenen Prozessoren liegt eine deutlich höhere Stichprobe vor. Trotzdem lässt sich daraus bereits eine erste positive Tendenz für den Core Ultra 7 251HX ableiten.





Source link

Weiterlesen

Beliebt