Connect with us

Apps & Mobile Entwicklung

Wie viel mehr Performance bringt die neue GPU-Architektur?


Blackwell und RDNA 4, also GeForce RTX 5000 und Radeon RX 9000, setzen gegenüber den Vorgängern Lovelace und RDNA 3 auf eine neue Architektur. ComputerBase hat beide bereits ausführlich getestet. Was noch fehlte: die „IPC-Analyse“. Haben die neuen Shadereinheiten auch an Leistung pro Takt zugelegt? Das klärt der Test.

Warum sind RTX 5000 und RX 9000 schneller?

Nvidia und AMD haben dieses Jahr mit Blackwell (RTX 5000) sowie RDNA 4 (RX 9000) neue Grafikkarten auf den Markt gebracht. Sie bieten neue Features und sind auch schneller als die vergleichbaren Vorgänger. Dafür verantwortlich: Mehr Ausführungseinheiten, höhere Taktraten, schnellerer Speicher, mehr Verbrauch – und auch mehr Leistung pro Shader pro Takt (IPC)?

Sieht so aus, denn Nvidia sprach unter anderem von deutlich schnelleren Raytracing-Einheiten, während AMD quasi durchweg die Compute Units verbessert haben will. Doch mit handfesten Auswirkungen auf die Gaming-Leistung unterlegt wurden die versprochenen IPC-Fortschritte nicht. ComputerBase holt das jetzt nach.

Dem IPC-Zugewinn in Spielen auf der Spur

Wie viel mehr Geschwindigkeit bringt die Blackwell-Architektur gegenüber Lovelace und RDNA 4 gegenüber RDNA 3 bei theoretisch gleicher Rechenleistung? Das soll dieser Artikel herausfinden, indem „Blackwell“ und „Lovelace“ sowie „RDNA 4“ und „RDNA 3“ jeweils bei möglichst gleicher Rechenleistung gegenübergestellt werden. Treten dennoch Leistungsunterschiede auf, muss dafür eine Architekturverbesserung verantwortlich zeichnen.

So wurden die Grafikkarten getestet

Um zu untersuchen, inwieweit sich die „IPC“ bei Grafikkarten geändert hat, ist es notwendig, die theoretische Rechenleistung so gut es geht anzugleichen. Das ist in dieser Generation gar nicht so einfach.

Nvidia GeForce: Blackwell vs. Ada Lovelace

Bei den Nvidia-Grafikkarten fiel die Wahl schlussendlich auf GeForce RTX 5070 Ti und GeForce RTX 4070 Ti Super, denn beide stehen sich im aktuellen Portfolio am nächsten.

Auch GeForce RTX 5070 Ti und GeForce RTX 4070 Ti Super kommen mit einer unterschiedlichen Anzahl an Shadereinheiten daher (8.960 ALUs zu 8.448 ALUs), was über den Takt ausgeglichen werden musste. Die RTX 5070 Ti arbeitet in den Benchmarks mit etwa 2.360 MHz, die GeForce RTX 4070 Ti Super mit 2.500 MHz. Das Power Limit ist auf beiden Grafikkarten maximiert, doch spielt dies ohnehin keine einschränkende Rolle. Von GPU-Seiten sind die zwei Grafikkarten damit so ähnlich wie möglich – inklusive derselben L2-Cachegröße.

Nvidia Blackwell (RTX 5070 Ti, Links) und Lovelace (RTX 4070 Ti Super, Rechts)
Nvidia Blackwell (RTX 5070 Ti, Links) und Lovelace (RTX 4070 Ti Super, Rechts)

Beim Speicher sind die zwei 3D-Beschleuniger nicht auf einen Nenner zu bringen, da die GeForce RTX 5070 Ti mit GDDR7, die GeForce RTX 4070 Ti Super aber mit GDDR6X arbeitet. Den VRAM der RTX 5070 Ti Super hat ComputerBase in den Tests maximal untertaktet, weniger als 13.500 MHz sind aber nicht einstellbar. Die Speicherbandbreite beträgt damit 864 GB/s. Bei der RTX 4070 Ti Super lässt sich der Speicher um maximal 1.756 MHz übertakten. 12.256 MHz beträgt die Frequenz, was in 784 GB/s resultiert. Ein Unterschied bleibt. Erfahrungsgemäß hat die Speicherbandbreite bei Gaming-Grafikkarten, solange sie nur hoch genug ist, aber kaum einen Einfluss auf die Gaming-Performance, für diesen Vergleich sollte das passen.

Der Nvidia-Vergleich wurde in der Auflösung 3.840 × 2.160 mitsamt Upsampling durchgeführt.

AMD Radeon: RDNA 4 vs. RDNA 3

Die AMD-Grafikkarten haben für den Vergleich einen Vor- und einen Nachteil. Der Vorteil: Radeon RX 9060 XT und Radeon RX 7600 XT sind gleich konfiguriert: 2.048 FP32-ALUs, 64 ROPs, 32 MB Infinity Cache, 16 GB Speicher und derselbe Speichertyp. Der L2-Cache wächst bei der neuen Grafikkarte zwar von 2 MB auf 4 MB an, doch gehört dies eben auch zur unterschiedlichen Architektur hinzu. So weit, so gut.

Kompliziert wird es in diesem Fall beim GPU-Takt. Die Radeon RX 7600 XT arbeitet mit maximal 2.730 bis 2.800 MHz, mehr sind einfach nicht drin (Firmware). Die Radeon RX 9060 XT taktet derweil immer höher, selbst wenn der Takt auf das Minimum gesetzt wird. Zwischen 2.860 MHz und 2.890 MHz liegen an. Das ist eine Differenz, die sich nicht ändern lässt.

ComputerBase hat jedoch den durchschnittlichen Takt beider Grafikkarten in jedem Spiel notiert, die Benchmark-Ergebnisse werden um diesen Taktunterschied bereinigt.

AMD RDNA 4 (RX 9070 XT, Links) und RDNA 3 (RX 7600 XT, Rechts)
AMD RDNA 4 (RX 9070 XT, Links) und RDNA 3 (RX 7600 XT, Rechts)

Dafür machen es einem die Radeons beim Speicher aber zumindest etwas einfacher. Beide Grafikkarten haben ein 128-Bit-Interface, beide nutzen GDDR6. Der VRAM der Radeon RX 7600 XT taktet mit 9.000 MHz, der der Radeon RX 9060 XT mit 10.000 MHz. Untertakten lässt sich der Speicher der RX 9060 XT nicht, dafür der der RX 7060 XT auf 9.748 MHz übertakten. Die Differenz in der Speicherbandbreite ist so gering, dass dies keinen Einfluss auf die Spiele-Leistung haben sollte.

Der AMD-Vergleich wurde in der Auflösung 2.560 × 1.440 mitsamt Upsampling durchgeführt.

Nvidia-Benchmarks: Blackwell gegen Lovelace

Rasterizer-Grafik

Nvidia wirbt bei Blackwell unter anderem mit einer deutlich gestiegenen Integer-Performance, in Spielen bringt dies aber schlicht und ergreifend nichts. Im Durchschnitt von 19 Spielen bei reiner Rasterizer-Grafik sind Blackwell und Lovelace bei gleicher Rechenleistung schlicht gleich schnell. Ja, die neue Architektur liegt 1 Prozentpunkt vor der alten Technik, doch dies kann auch der höheren Speicherbandbreite geschuldet sein. 1 Prozent ist aber ohnehin nichts, was als „schneller“ bezeichnet werden könnte.

Performancerating, Rasterizer – 3.840 × 2.160, Blackwell vs. Lovelace

    • Blackwell (RTX 5070 Ti angepasst)

    • Lovelace (RTX 4070 Ti S angepasst)

Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

In einzelnen Spielen zeigen sich kleinere Unterschiede, was jedoch auch bedeutet, dass Blackwell ab und zu auch mal etwas langsamer ist. In Atomfall ist die angepasste GeForce RTX 5070 Ti zum Beispiel 3 Prozent schneller als die ebenso angepasste GeForce RTX 4070 Ti Super unterwegs. In God of War Ragnarök ist Blackwell 4 Prozent schneller, in Kingdom Come Deliverance 2 5 Prozent, in The Last of Us Part II noch einmal 5 Prozent und in Warhammer 40k: Space Marine 2 immerhin sogar 6 Prozent. Das ist alles nicht viel, aber zumindest mehr als die durchschnittlichen 1 Prozent.

In Call of Duty: Black Ops 6 liegt die RTX 4000 wiederum 3 Prozent vor RTX 5000, in Ghost of Tsushima sogar 5 Prozent. In Spider-Man 2 kommen noch einmal 3 Prozent oben drauf und in Oblivion Remastered 2 Prozent. Schlussendlich ist Blackwell dadurch im Durchschnitt nur 1 Prozentpunkt schneller als Ada Lovelace.

3.840 × 2.160, Blackwell vs. Lovelace

Assassin’s Creed Shadows – 3.840 × 2.160, Blackwell vs. Lovelace

    • Blackwell (RTX 5070 Ti angepasst)

    • Lovelace (RTX 4070 Ti S angepasst)

    • Blackwell (RTX 5070 Ti angepasst)

    • Lovelace (RTX 4070 Ti S angepasst)

Einheit: Bilder pro Sekunde (FPS)

Raytracing-Grafik

Neben der erhöhten Integer-Performance spricht Nvidia bei Blackwell auch von schnelleren Raytracing-Einheiten. Dies scheint aber ebenso absolut im Nichts zu verpuffen, denn mit Raytracing ist Blackwell bei gleicher Rechenleistung sogar geringfügig langsamer als Lovelace. Der einprozentige Vorsprung der neuen Technologie bei Rasterizer-Grafik verwandelt sich in einen einprozentigen Rückstand bei Raytracing.

Das ist keine neue Beobachtung, denn die RTX-5000-Modelle konnten sich mit Raytracing zuletzt immer weniger gut von den RTX-4000-Vorgängern absetzen als bei Rasterizer-Grafik. Der neue Vergleichstest zeigt jetzt aber, dass Blackwell und Lovelace bei Raytracing im Bereich der Messungenauigkeit eigentlich gleich schnell sind – im Durchschnitt.

Die einzelnen Benchmarks zeigen, dass es je nach Spiel größere Schwankungen gibt. Entsprechend kann dies auch schlicht an der Spiele-Auswahl liegen, dass der Durchschnitts-Wert so ausfällt wie er ausfällt.

Performancerating, Raytracing – 3.840 × 2.160, Blackwell vs. Lovelace

    • Lovelace (RTX 4070 Ti S angepasst)

    • Blackwell (RTX 5070 Ti angepasst)

Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

Silent Hill 2 ist zum Beispiel ein gutes Spiel für Blackwell, hier liefert die neue Technik 9 Prozent mehr Bilder pro Sekunde als Lovelace. Dragon Age: The Veilguard läuft noch 2 Prozent schneller, Monster Hunter Wilds 1 Prozent.

Probleme hat Blackwell dagegen mit Assassin’s Creed Shadows, das auf Lovelace wiederum ordentliche 9 Prozentpunkte schneller läuft. Indiana Jones zeigt 6 Prozent mehr FPS auf der alten Hardware, in Doom: The Dark Ages sind es 2 Prozent.

Pathtracing-Grafik

Auch mit Pathtracing-Grafik kann sich die neue Architektur nicht von der alten absetzen. Im Durchschnitt läuft Blackwell 1 Prozentpunkt schneller als Lovelace, wobei der Schnitt auch nur aus drei Spielen gebildet wird.

Performancerating, Pathtracing – 3.840 × 2.160, Blackwell vs. Lovelace

    • Blackwell (RTX 5070 Ti angepasst)

    • Lovelace (RTX 4070 Ti S angepasst)

Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

Black Myth: Wukong läuft mit Pathtracing 1 Prozent schneller auf Blackwell als auf Lovelace. Interessant sind die Ergebnisse von F1 25 und Indiana Jones. Ersteres lief mit normalen Raytracing auf beiden Technologien gleich schnell, mit Pathtracing ist Blackwell 2 Prozent schneller. Einen noch größeren Unterschied gibt es bei Indiana Jones. Mit Raytracing ist Lovelace hier 6 Prozent schneller als Blackwell, mit Pathtracing sind es nur noch 2 Prozent.

AMD-Benchmarks: RDNA 4 gegen RDNA 3

Bei Nvidia hat es mit der neuen Generation keinen architekturbedingten Leistungssprung gegenüber der vorherigen Generation gegeben. Bei AMD ist der Sprung mit RDNA 4 dagegen groß. Die neuen Grafikkarten bieten bei gleicher Rechenleistung deutlich mehr Geschwindigkeit als der Vorgänger RDNA 3. Seit dem Wechsel von GCN auf RDNA ist dies der größte Leistungssprung von AMD.

Rasterizer-Grafik

AMD RDNA 4 arbeitet bei gleicher theoretischer Rechenleistung im Durchschnitt um 20 Prozent schneller als der Vorgänger RDNA 3. Das passt zu der massiven Leistungssteigerung der Radeon RX 9070 XT im Vergleich zur Radeon RX 7800 XT, obwohl erstere kaum mehr Ausführungseinheiten bietet.

Performancerating, Rasterizer – 2.560 × 1.440, RDNA 4 vs. RDNA 3

    • RDNA 4 (RX 9060 XT angepasst)

    • RDNA 3 (RX 7600 XT angepasst)

Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

In einzelnen Spielen ist RDNA 4 dabei gar nicht schneller als RDNA 3. In Atomfall arbeiten beide Architekturen zum Beispiel gleich schnell, in Final Fantasy XVI ist die Differenz mit 7 Prozent auch nicht gerade riesig. Aber es gibt auch andere Beispiele und sie sind im Parcours in der Überzahl: In Black Myth Wukong liefert RDNA 4 29 Prozent mehr FPS, in Spider-Man 2 30 Prozent, in Horizon Forbidden West 33 Prozent und in God of War: Ragnarök gleich massive 43 Prozent.

2.560 × 1.440, RDNA 4 vs. RDNA 3

Assassin’s Creed Shadows – 2.560 × 1.440, RDNA 4 vs. RDNA 3

    • RDNA 4 (RX 9060 XT angepasst)

    • RDNA 3 (RX 7600 XT angepasst)

    • RDNA 4 (RX 9060 XT angepasst)

    • RDNA 3 (RX 7600 XT angepasst)

Einheit: Bilder pro Sekunde (FPS)

Raytracing-Grafik

AMD hat Raytracing in RDNA 4 massiv verbessert und das zeigt sich auch in den Benchmarks. Im Schnitt arbeitet RDNA 4 31 Prozent schneller als RDNA 3, was noch einmal 11 Prozentpunkte mehr sind als bei reiner Rasterizer-Performance.

Performancerating, Raytracing – 2.560 × 1.440, RDNA 4 vs. RDNA 3

    • RDNA 4 (RX 9060 XT angepasst)

    • RDNA 3 (RX 7600 XT angepasst)

Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

In den einzelnen Spielen wird es teils richtig wild: Zwischen 30 und 35 Prozent mehr Bilder pro Sekunde sind die meisten Spiele angesiedelt, was aber noch nicht das Ende der Fahnenstange ist. So liefert F1 25 42 Prozent mehr FPS, bei Doom: The Dark Ages sind es gleich 44 Prozent. Assassin’s Creed Shadows legt wiederum „nur“ um 17 Prozent zu – das Schlusslicht im Test.

Pathtracing-Grafik

RDNA 4 ist zwar nicht wirklich für massive Pathtracing-Last gedacht, die RT-Verbesserungen der Architektur schlagen in dem Szenario aber gleich doppelt durch: Im Durchschnitt ist RDNA 4 in diesem Szenario fast doppelt so schnell, durchschnittlich 83 mehr FPS lassen sich in den drei getesteten Spielen messen.

Performancerating, Pathtracing – 2.560 × 1.440, RDNA 4 vs. RDNA 3

    • RDNA 4 (RX 9060 XT angepasst)

    • RDNA 3 (RX 7600 XT angepasst)

Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

In Einzelergebnissen ausgedrückt bedeutet dies für RDNA 4 72 Prozent mehr FPS in F1 25, 77 Prozent mehr in Indiana Jones und 101 Prozent mehr FPS in Black Myth Wukong.

Fazit

Aufgrund der beschriebenen Einschränkungen beim Angleichen der Rechenleistung zwischen Blackwell und Lovelace respektive RDNA 4 und RDNA 3 war der Vergleich der Spieleleistung der Architekturen zwar nicht bis ins letzte Detail perfekt möglich, an der Aussagekraft der Ergebnisse – auch in ihrer Deutlichkeit – besteht aber kein Zweifel:

  1. Nvidia Blackwell ist gegenüber dem Vorgänger Lovelace in Spielen nicht schneller, weder in Rasterizer-, noch in Raytracing oder Pathtracing-Szenarien. Ja, es gibt einzelne Spiele, in denen Blackwell voraus liegt, genauso gibt es aber auch Titel, die auf Lovelace mehr Performance bieten. Generell mehr Leistung bringt die Architektur nicht. Die GeForce-RTX-5000-Generation holt ihren Leistungsvorteile gegenüber RTX 4000 über mehr Ausführungseinheiten, mehr Takt, eine höhere Leistungsaufnahme sowie neuere Features.
  2. Ganz anders sieht das bei AMD aus. RDNA 4 macht gegenüber RDNA 3 einen großen Schritt, den weitaus größten Schritt seit dem Wechsel von GCN zu RDNA. Es gibt 20 Prozent mehr FPS in Rasterizer-Spielen, 31 Prozent mehr FPS in Raytracing-Titeln und 83 Prozent mehr Leistung in Pathtracing-Spielen. Das ist ein massiver Sprung, der in der Praxis darüber hinaus noch durch höhere Taktraten vergrößert wird. Bei der RX-9000-Generation kommt rund die Hälfte der FPS-Steigerung durch die modernere Architektur, die andere durch höhere Taktraten zu Stande – das gilt zumindest für den Vergleich RX 9070 XT zu RX 7800 XT. Bei Raytracing-Spielen verschiebt sich der Anteil in Richtung Architektur.
RTX 5000, RTX 4000, RX 9000 und RX 9000 im Architektur-Vergleich
RTX 5000, RTX 4000, RX 9000 und RX 9000 im Architektur-Vergleich

Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.



Source link

Apps & Mobile Entwicklung

EcoFlow Trail-Serie: Tragbare DC-Powerstations mit bis zu 300 Watt Leistung


EcoFlow Trail-Serie: Tragbare DC-Powerstations mit bis zu 300 Watt Leistung

Bild: EcoFlow

Mit der Trail-Serie bringt EcoFlow eine neue DC-Powerstation-Serie auf den Markt, die für Festivals, längere Ausflüge und Camping gedacht ist. Die Produktreihe startet mit drei Modellen – Trail 200 DC, Trail 300 DC und Trail Plus 300 DC.

Vorbestellungen starten mit Gratis-Ladegerät

Zuletzt waren bereits Details zur neuen Serie bekannt gegeben worden, ein Preis und die Möglichkeit zum Kauf fehlten aber bislang. Dies ändert sich nun und die neuen DC-Powerstations können ab heute vorbestellt werden, zumindest für die Trail 200 DC und Trail 300 DC, denn die Trail Plus 300 DC wird erst später auf den Markt kommen. Einen genauen Termin nennt EcoFlow noch nicht.

Die Trail 200 DC und Trail 300 DC können dabei ab sofort für 149 bzw. 179 Euro bei Amazon vorbestellt werden*. Während der Frühbucherphase vom 22. September bis 22. Oktober erhalten Kunden ein kostenloses 65-Watt-Ladegerät von EcoFlow dazu. Die unverbindliche Preisempfehlung der Trail Plus 300 DC liegt bei 199 Euro.

EcoFlow Trail Plus 300 DC (Bild: EcoFlow)

Unterschiede bei Leistung, Kapazität und Anschlüssen

Die Trail 200 DC ist das kleinste und leichteste Modell der Serie, die Trail 300 DC bietet hingegen mehr Leistung und eine größere Akkukapazität. Die Trail Plus 300 DC entspricht bei der Kapazität der Trail 300 DC, setzt aber statt auf LiFePO4 auf NCM beim Akku und bietet zusätzliche Anschlüsse mit einem schnelleren Laden mehrerer Geräte. Vorteil des NCM-Akkus ist das geringere Gewicht, dafür ist die Akkulebensdauer bei LiFePO4 länger. Das Gewicht der DC-Powerstations startet bei 1,83 kg. Laut EcoFlow sind sie bis zu 60 Prozent kleiner und 48 Prozent leichter als vergleichbare Powerstations der Konkurrenz.

EcoFlow Trail 300 DC (Bild: EcoFlow)

Nur die Trail Plus 300 DC bietet drei USB-C-Anschlüsse mit jeweils bis zu 140 Watt. Nur sie verfügt auch über eine App-Unterstützung, die über integriertes Bluetooth und WLAN funktioniert. In diesem Modell ist zudem eine Camping-Lampe integriert. Die beiden 300er-Modelle lassen sich zudem über einen XT60-Solaranschluss mit bis zu 110 Watt mittels Sonnenenergie aufladen, um autark von Stromquellen genutzt werden zu können. Laden lassen sich alle Modelle auch über die verbauten USB-C-Anschlüsse, wobei über mehrere Anschlüsse gleichzeitig geladen werden kann. Beim teuersten Modell kann der Tragegriff zudem abgenommen werden und bietet ein integriertes USB-C-Kabel. Die nachfolgende Tabelle verdeutlicht die Unterschiede der Modelle detailliert.

Unterschiede und Daten der neuen DC-Powerstations

Alle drei Powerstations verfügen übe rein Display, auf dem der Akkuladestand, die Ein- und Ausgangsleistung sowie die voraussichtliche Restlaufzeit eingesehen werden kann.

EcoFlow Trail 200 DC (Bild: EcoFlow)

ComputerBase hat Informationen zu diesem Artikel von EcoFlow unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.

(*) Bei den mit Sternchen markierten Links handelt es sich um Affiliate-Links. Im Fall einer Bestellung über einen solchen Link wird ComputerBase am Verkaufserlös beteiligt, ohne dass der Preis für den Kunden steigt.



Source link

Weiterlesen

Apps & Mobile Entwicklung

MediaTek Dimensity 9500: Der erste Smartphone-Chip mit Arms C1-Kernen und 4,21 GHz


MediaTek ist der erste Anbieter eines Smartphone-Chips auf Basis der C1-Kerne von Arm. Der Dimensity 9500 führt neben der neuen CPU und Mali-G1-Ultra-GPU von Arm eine stärkere NPU mit „Compute in Memory“ und Unterstützung für ternäre KI-Modelle ein. Im Oktober sollen erste Smartphones mit Dimensity 9500 vorgestellt werden.

Fertigung in 3 nm bei TSMC

Der Dimensity 9500 wird in der dritten Generation der 3-nm-Fertigung von TSMC produziert. Dabei müsste es sich somit um den N3P getauften Node handeln, der auf N3B und N3E folgt. MediaTek hat die Nutzung von N3P auch gegenüber ComputerBase bestätigt. Das ist derselbe Fertigungsprozess, den Apple für die A19-Familie nutzt.

Acht neue C1-CPU-Kerne von Arm

MediaTek bringt für die CPU als erstes Unternehmen die neuen C1-Kerne von Arm zum Einsatz, die die britischen Entwickler erst vor knapp zwei Wochen als Teil der Lumex CSS Platform vorgestellt haben. Deren große Neuerung ist die Scalable Matrix Extension 2 (SME2) für schnelles und effizientes AI direkt auf der CPU.

Die Umsetzung von MediaTek weicht insofern von Arms Referenzplattform ab, als dass nicht nur die C1-Ultra- und C1-Pro-, sondern auch die C1-Premium-Kerne knapp unterhalb der C1-Ultra zum Einsatz kommen. Zur Erinnerung: C1-Ultra und C1-Premium sitzen ober- respektive unterhalb des vorherigen Cortex-X900, die C1-Pro auf dem Niveau des Cortex-A700 und die C1-Nano auf dem Niveau des Cortex-A500.

Arm Lumex CSS Platform – CPU (Bild: Arm)

All-Big-Core-Design mit bis zu 4,21 GHz

MediaTek verbaut einen C1-Ultra, drei C1-Premium und vier C1-Pro, sodass erneut mit einem „All Big Core Design“ ohne E-Kerne geworben wird. Die Kerne laufen mit bis zu 4,21 GHz, 3,5 GHz und 2,7 GHz und kommen auf 2 MB, 1 MB und 512 KB L2-Cache. Der L3-Cache beläuft sich auf 16 MB und der System Level Cache (SLC) liegt bei 10 MB.

Der Chip-Entwickler verspricht eine bis zu 32 Prozent höhere Single-Core-Leistung gegenüber dem Dimensity 9400 und einen bis zu 37 Prozent niedrigeren Energiebedarf für die gesamte CPU. Kommt SME2 auf der CPU zum Beispiel für die Objekterkennung zum Einsatz, könne die Leistung bis zu 57 Prozent höher, der Energieverbrauch bis zu 50 Prozent niedriger ausfallen.

Mali G1-Ultra mit doppelt so schnellem Raytracing

Für den Dimensity 9500 greift MediaTek auch bei der GPU auf die neueste Generation und innerhalb des Portfolios auf das Topmodell von Arm zurück. Die Mali G1-Ultra mit 12 Kernen soll in der Spitze 33 Prozent schneller sein als die Immortalis-G925 MC12 des Dimensity 9400 und dabei bis zu 42 Prozent effizienter arbeiten. Analog zur Angabe von Arm wirbt auch MediaTek mit einer bis zu doppelt so hohen Raytracing-Leistung, was auf die Ray Tracing Unit der zweiten Generation (RTUv2) zurückzuführen ist. In ausgewählten Raytracing-Spielen sollen sich damit erstmals bis zu 120 FPS erreichen lassen.

Arm Lumex CSS Platform – GPU (Bild: Arm)

NPU 990 mit Compute in Memory

Obwohl Arm mittels SME2 mehr AI direkt auf der CPU ermöglicht, verbaut MediaTek mit der NPU 990 auch weiterhin einen eigenen KI-Beschleuniger im Dimensity 9500. Das Unternehmen wirbt mit der ersten CIM-NPU in einem Smartphone, wobei das Kürzel für „Compute in Memory“ steht. MediaTek versteht das Feature als eine Art L1-Cache für die NPU, um die Speicherzugriffe auf den DRAM zu reduzieren und damit die Effizienz zu steigern. Beim RAM übernimmt der Dimensity 9500 das LPDDR5X-10667-Interface des Vorgängers. Beim Storage lässt sich bis zu UFS 4.1 mit bis zu vier Lanes anbinden.

Support für ternäre KI-Modelle

MediaTek gibt für die NPU eine bis zu doppelt so hohe Integer- und Floating-Point-Leistung an und wirbt mit der Hardware-Beschleunigung erstmals auch für ternäre Large Language Models. Im Detail wird das von Microsoft-Forschern entwickelte BitNet b1.58 unterstützt. Der Name „1.58“ leitet sich von den drei Zuständen -1, 0 und +1 für die Gewichte des LLMs ab, da ein System mit log₂ 3 ≈ 1,58 Bits an Informationen enthält. MediaTek unterstützt auf der NPU auch wieder das LoRA-Training (Low-Rank Adaptation) von LLMs, das ein effizientes Feintuning großer, bereits vortrainierter Sprachmodelle mit einer Untermenge der Parameter des Modells mit weniger Speicher- und Rechenaufwand zum Ziel hat.

MediaTek Dimensity 9500
MediaTek Dimensity 9500 (Bild: MediaTek)

Die Hardware-Architektur der „Generative AI Engine 2.0“ innerhalb der NPU 990 sei MediaTek zufolge speziell für Transformer-Modelle ausgelegt und könne jetzt erstmals auch Bilder in 4K-Auflösung schnell und effizient auf dem Smartphone generieren.

Bildprozessor und Mobilfunkmodem aufgewertet

MediaTek legt auch in Bereichen wie dem Bildprozessor (ISP) und dem integrierten Mobilfunkmodem nach. Der ISP ist zum Beispiel für bis zu 200-MP-Fotos, 4K120-Video mit Dolby Vision oder einen Video-Porträtmodus mit bis zu 4K60 ausgelegt. Das neue Modem von MediaTek, das von 2G is 5G reicht, kann bis zu fünf statt vorher vier Frequenzblöcke zusammenlegen (5CC-CA) und soll damit, sofern es das jeweilige Netz ermöglicht, eine bis zu 15 Prozent höheren Spitzengeschwindigkeit erreichen. MediaTek gibt das Maximum im Downlink mit 7,4 Gbit/s an. Mobilfunk und WLAN lassen sich für noch höhere Geschwindigkeiten auch kombinieren.

Erste Smartphones mit Dimensity 9500 im Oktober

Erste Smartphones mit dem Dimensity 9500 sollen MediaTek zufolge im Oktober angekündigt werden. Als erste Abnehmer wurden Vivo und Oppo genannt.

ComputerBase hat Informationen zu diesem Artikel von MediaTek unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.



Source link

Weiterlesen

Apps & Mobile Entwicklung

One UI 8: Samsung verteilt Android 16 für Galaxy Z Flip 6 und Z Fold 6


One UI 8: Samsung verteilt Android 16 für Galaxy Z Flip 6 und Z Fold 6

Bild: Samsung

Samsung hält das Update-Tempo aufrecht und veröffentlicht nur eine Woche nach dem offiziellen Start von One UI 8 auf dem Galaxy S25 nun Android 16 für das Galaxy Z Flip 6 und das Z Fold 6 (Test), für das der südkoreanische Hersteller ursprünglich lediglich „im Verlauf des Jahres“ als Startzeitraum in Aussicht gestellt hatte.

Faltbare Smartphones erhalten das Update nun ebenfalls

Damit bringt Samsung die neue Android-Version samt eigenen Erweiterungen auch auf seine beiden faltbaren Smartphones, nachdem diese in den vergangenen Wochen bereits mit zwei Beta-Versionen ausgiebig getestet werden konnten. Mit an Bord sind neben den Funktionen der aktuellen Android-Version unter anderem die neue Adaptiv Clock, die mit „Now Brief“ eingeführten personalisierten Tagesaktualisierungen sowie eine durch Knox Enhanced Encrypted Protection (KEEP) weiter verbesserte Sicherheit.

Zuerst erhalten Teilnehmer des Beta-Programms auf dem Galaxy Z Flip 6 die Firmware-Version F741NKSU2CYI6, während Nutzer des Galaxy Z Fold 6 Version F956NKSU2CYI7 erhalten. Für beide Geräte werden auf etwa 600 MB die letzten Änderungen und Korrekturen für die nun verteilte stabile Version aufgespielt. Es dürfte allerdings nicht mehr lange dauern, bis auch alle übrigen Nutzer das dann rund vier Gigabyte große Major-Release als OTA-Update erhalten. Alternativ dürfte die neue Version voraussichtlich auch erneut über die ODIN-App als Image installiert werden können. Beide Smartphones erhalten mit dem Update zudem die Sicherheitspatches Stand 1. September 2025.

Android 16 für weitere Modelle bereits in den Startlöchern

Sollte Samsung das bisherige Tempo seiner Veröffentlichungen beibehalten, dürfte One UI 8 auch für das Galaxy S24 (Test) sowie die 2024 erschienenen Foldables Galaxy Z Flip 5 und das Z Fold 5 (Test) nicht lange auf sich warten lassen.



Source link

Weiterlesen

Beliebt