Apps & Mobile Entwicklung
Crucial P510 PCIe 5.0 SSD im Test
Was leistet der effiziente E31T-Controller von Phison, wenn er mit Microns jüngstem G9-TLC-NAND kombiniert wird? Diese Frage beantwortet der Test der Crucial P510 SSD, die die Lücke zwischen den PCIe-4.0-Flaggschiffen und dem High-End mit PCIe 5.0 schließen soll.
Crucial P510 im Überblick
Die Crucial P510 wurde von Micron gemeinsam mit Phison zur CES 2025 vorgestellt. Sie ist die erste SSD, die den neuen E31T-Controller von Phison mit Microns neuem G9-TLC-NAND mit 276 Layern kombiniert. Die P510 soll sequenzielle Durchsatzraten von 11.000 MB/s lesend und 9.500 MB/s schreibend erreichen, sitzt also von der Leistung her zwischen den High-End-Modellen mit PCIe 4.0 (~ 7.000 MB/s) und PCIe 5.0 (~14.000 MB/s).
Im Test erweist sich auch diese Mischung als effizient, liegt bei der Leistung aber leicht hinter anderen Modellen mit Phison E31T und deutlich dichter an den PCIe-4.0-Flaggschiffen als dem Spitzenfeld mit PCIe 5.0.
- Leistung der schnellsten PCIe 4.0 SSDs
- Geringe Anforderungen an die Kühlung
- Langsamer als andere mit Phison E31T
Test (-muster) mit Verspätung
Erste Testberichte sollten ursprünglich bereits Anfang April erscheinen, doch kam es aufgrund globaler Lieferprobleme beim Versand der Testmuster zu Verzögerungen. Das betraf auch ComputerBase, sodass das Testmuster erst wesentlich später eingetroffen ist. Der Zeitpunkt war aufgrund anderer Termine ungünstig, sodass der Test erst jetzt erfolgt.
Das Testmuster im Detail
Auf der einseitig bestückten M.2-Platine mit 80 mm Länge sitzen Controller und Speicherchips, einen DRAM-Cache gibt es nicht. Der E31T-Controller von Phison kann stattdessen die NVMe-Funktion Host Memory Buffer (HMB) nutzen, um einige Megabyte aus dem Arbeitsspeicher des Systems als Zwischenspeicher zu verwenden. Das genügt für die meisten Alltagsaufgaben völlig.
- Phison E31T SSD-Controller im Test: Ausblick auf effiziente PCIe-5.0-SSDs
- Corsair MP700 Elite im Test: Die erste PCIe-5.0-SSD mit effizientem E31T-Controller
Beim NAND-Flash handelt es sich um Microns TLC-Speicher der G9-Generation mit 276 Layern und 1 Tbit Speicherkapazität pro Die. Das ist ein Unterschied zu den ersten SSDs mit dem E31T: Die Corsair MP700 Elite (Test) nutzt nämlich den BiCS8-TLC-NAND von Kioxia. Der Test der Crucial P510 zieht somit auch einen Vergleich zwischen den Speichertypen, allerdings spielt immer auch die jeweilige Firmware eine Rolle.
Garantie und TBW im Vergleich
Bei üblichen fünf Jahren Garantie erlischt selbige nach Überschreiten einer vom Hersteller festgelegten Schreibmenge vorzeitig: die „Total Bytes Written“ (TBW). Bei der Crucial P510 mit 1 TB liegt diese bei typischen 600 TB für SSDs mit TLC-Speicher.
Preise und Eckdaten im Überblick
Zur Stunde ist die Crucial P510 in der getesteten Version ohne Kühlkörper zu Preisen von rund 110 Euro (1 TB) und 180 Euro (2 TB) erhältlich. Für etwa 10 Euro Aufpreis gibt es die Variante mit Kühler.
PCIe 5.0 vs. PCIe 3.0/4.0 und SATA im neuen Testsystem
Die Probanden müssen im Test gegen die High-End-Konkurrenz mit PCIe 5.0 wie die SanDisk WD_Black SN8100 (Test) und die Samsung 9100 Pro (Test) sowie die Flaggschiffe der PCIe-4.0-Generation in Form der WD_Black SN850X (Test) und der Samsung 990 Pro (Test) antreten. Auch ein Vergleich mit SSDs der langsameren Sorte auf Basis von PCIe 3.0 und SATA sowie mit externen Modellen wird gezogen.

Der Wechsel auf PCIe 5.0 seitens der SSDs machte auch einen Wechsel des Testsystems von ComputerBase nötig. Die Wahl fiel auf AMDs aktuelle AM5-Plattform mit einem B650E-Mainboard von Asus und dem mit 65 Watt TDP antretenden 12-Kern-Prozessor Ryzen 9 7900 (Test). Der primäre M.2-Slot des Mainboards erhält PCIe 5.0 x4 direkt über die CPU. Beim Betriebssystem fand ein Umstieg auf Windows 11 statt.
Nachfolgend werden die ab jetzt für SSD-Tests verwendete Hard- und Software aufgelistet.
- Windows 11 Pro 22H2 22621.1413
- AMD Ryzen 9 7900
- Asus B650E-F Strix Gaming Wifi
- DDR5-5200, 38-38-38-84
- AMD-Chipsatztreiber 5.02.19.2221
- GeForce RTX 2080 Ti mit GeForce-Treiber 531.29
- GeForce RTX 3080 Ti mit GeForce-Treiber 552.22 (Zusatztest Direct Storage)
- SoftPerfect RAMdisk 4.4
- Asus BIOS 1222
Die Angabe und die dauerhafte Verwendung der konkreten Version von Windows 11 sind entscheidend, denn Microsoft hat zuletzt verstärkt an der Datenträger-Leistung im Explorer gearbeitet. So erzielt die neue Plattform beim Kopieren aus der RAM-Disk auf eine sehr schnelle SSD über 6,0 GB/s, wo die alte Plattform mit denselben SSDs bei unter 2,5 GB/s an eine Grenze stieß. Auch das Kopieren auf der SSD ist mit dem neuen System und insbesondere dem aktuelleren Windows viel schneller. Die letzten inkrementellen Updates für Windows 11 22H2 brachten dabei noch mal einen deutlichen Schub gegenüber der ersten Hauptversion aus dem 4. Quartal 2022 – mit der lag das Limit im Explorer noch bei knapp unter 4,0 GB/s.
Testergebnisse und Benchmarks
Das Testmuster wurde für die nachfolgenden Tests, sofern nicht anders vermerkt, unter dem SSD-Kühler des Asus ROG Strix B650E-F Wifi mit darüber blasendem 120-mm-Lüfter getestet.
Schreibleistung (SLC-Modus)
Wie ausdauernd der SLC-Modus ausfällt, testet ComputerBase wie folgt: Eine komprimierte RAR-Datei mit 10 GB Größe wird aus einer RAM-Disk mit fortlaufender Nummer in der Dateibezeichnung so oft ohne Pause auf die leere Test-SSD geschrieben, bis die Kapazitätsgrenze erreicht ist (grün). Für jeden Kopiervorgang wird die erreichte Transferrate protokolliert. Direkt nach dem letzten Transfer werden 50 Prozent der erstellten Dateien gelöscht. Im Anschluss wird der SSD für die interne Speicherverwaltung eine halbe Stunde Ruhe gegönnt. Dann wird sie abermals mit den RAR-Dateien vollgeschrieben (gelb). Der Test soll die Abhängigkeit des SLC-Modus vom Füllgrad der SSD ermitteln beziehungsweise aufzeigen, ob der einmal genutzte SLC-Modus sich nach Ruhephasen erholt.
Rund 70 GB SLC-Cache stehen für schnelle Schreibtransfers zur Verfügung, sofern die SSD leer ist, bei 50 Prozent Füllstand ist der Zwischenspeicher entsprechend nur noch halb so groß. Er richtet sich also dynamisch nach dem freien Speicherplatz. Dass alle Zellen zunächst im SLC-Modus beschrieben werden, ist hier also nicht der Fall.
Ungewöhnlich ist das Verhalten, sobald der Cache erschöpft ist. Dann fällt die Schreibrate zunächst rapide auf das Minimum ab, um sich im späteren Verlauf wieder zu erholen. Meist ist der Verlauf jedoch genau andersherum. Andere Modelle mit Phison E31T zeigen ein ganz anderes Verhalten. Das beweist aber auch, dass Crucial auf eine eigene Firmware setzt.
- Schwarz/Weiß: NVMe-SSDs (PCI Express 5.0, M.2)
- Rot: NVMe-SSDs (PCI Express 4.0, M.2)
- Blau: NVMe-SSDs (PCI Express 3.0, M.2)
- Grün: Externe SSDs (USB, Thunderbolt)
- Gelb: SATA-SSDs (2,5 Zoll)
Hinweis: Über die Schaltfläche oben rechts im Diagramm (+…Einträge) lassen sich weitere Ergebnisse einblenden, die zur besseren Übersicht zunächst versteckt sind.
Leseleistung
Zur Überprüfung der praktischen Leseleistung wird der Installationsordner des Spiels Shadow of the Tomb Raider (SotTR, 32 GB) auf das Testmuster kopiert und anschließend in die RAM-Disk gelesen. Das Gegenstück sollte in diesem Fall also erneut keinen Flaschenhals darstellen. Dies geschieht einmal mit völlig leerem Laufwerk und einmal praxisnah mit 80 Prozent Füllstand. Der Testlauf im leeren Zustand erfolgt 30 Minuten nach der Formatierung. Der Testlauf bei 80 Prozent wird auf dem zuerst zu 100 Prozent und dann ausgehend von 50 Prozent vollgeschriebenen Laufwerk durchgeführt, auf dem 20 Prozent gelöscht und dann 30 Minuten Pause eingelegt wurden.
Rund 4.000 MB/s schaffen viele aktuelle NVMe-SSDs und auch jene mit PCIe 4.0. In der Liga der PCIe-5.0-SSDs sind die 3.900 MB/s der Crucial P510 fast ganz unten anzusiedeln. Nur die Samsung 990 Evo (Plus) liegt mit halbiertem Interface (PCIe 5.0 x2 = PCIe 4.0 x4) noch darunter. Bei 80 Prozent Füllstand bricht die Leistung der P510 aber nicht ein, sodass die Platzierung am Ende besser ist und die Leserate auf Augenhöhe mit den anderen Modellen mit Phison E31T liegt.
Kopierleistung
Als Kopiertest (Lesen + Schreiben) hat die Redaktion einen 195 GB großen Steam-Ordner mit fünf installierten Spielen auf der SSD dupliziert. Dies geschieht einmal mit völlig leerem Laufwerk und einmal praxisnah mit 80 Prozent Füllstand. Der Testlauf im leeren Zustand erfolgt 30 Minuten nach der Formatierung. Der Testlauf bei 80 Prozent wird auf dem zuerst zu 100 Prozent und dann ausgehend von 50 Prozent vollgeschriebenen Laufwerk durchgeführt, auf dem 20 Prozent gelöscht und dann 30 Minuten Pause eingelegt wurden.
Dass das Testmuster nur 1 TB Speicher besitzt, ist ein Nachteil bei Schreibtests und auch beim Kopiervorgang. Dennoch ist das Resultat von weniger als 1.000 MB/s als schlecht zu bewerten. Selbst eine ältere WD Blue SN580 mit PCIe 4.0 und ebenfalls nur 1 TB kommt hier auf fast die doppelte Leistung. Ein Test mit 80 Prozent Füllstand entfällt für beide, da schlicht zu wenig Platz für die Testdaten ist.
Gaming-Leistung
Im ersten Teil wird fortan der DirectStorage-Benchmark (Avocados) stellvertretend für das Spiel Forspoken genutzt, da letzteres durch regelmäßige neue Versionen Probleme bei der Vergleichbarkeit machte. Im zweiten Teil wird der auf die Gaming-Leistung von Massenspeichern ausgerichtete 3DMark Storage verwendet.
Ein gutes Ergebnis von 26,1 GB/s Durchsatz kann in der BulkLoadDemo (Avocados) von Microsoft erreicht werden, die mit DirectStorage-API als Maßstab für künftige Spiele gilt. Selbst so manches Modell mit Phison E26 wird geschlagen. Zur Crucial P310 (Test) mit PCIe 4.0 liegt der Vorsprung bei immerhin 9 Prozent.
Nicht gerade rosig sind die 3.300 Punkte im 3DMark Storage, denn andere SSDs mit dem Phison E31T zeigen, dass locker zehn Prozent mehr Punkte möglich sind. Ein Beispiel ist die Kioxia Exceria G4 (Test). Somit gibt es in diesem Test keinen Vorsprung zu den PCIe-4.0-Flaggschiffen.
Office-Leistung
Der Quick System Drive Benchmark des PCMark 10 soll leichtere Aufgaben im Alltag widerspiegeln. Das Szenario reicht vom Schreiben, Lesen und Duplizieren von Bilddateien über die Anwendung von Adobe Illustrator und Photoshop bis Microsoft Excel.
Letztlich muss sich die Crucial P510 auch im PCMark10 bei simulierter Anwendungslast eher mit den schnellsten PCIe-4.0-SSDs als mit der PCIe-5.0-Spitzenklasse messen.
Theoretische Leistung
Der CrystalDiskMark hat sich quasi zum Standard-Benchmark der Branche gemausert und dient auch den SSD-Herstellern zur Ermittlung der beworbenen Leistungswerte. Wenig praxisnah, wird der Test an dieser Stelle zur Überprüfung der theoretischen Spitzenleistung verwendet.
Die 11.000 MB/s beim sequenziellen Lesen werden erfüllt. Die 80,8 MB/s beim wahlfreien Lesen sind ein gutes Resultat, doch hier erweisen sich andere Modelle mit dem gleichen Controller erneut schneller. Liegt es am Ende doch am Micron-Speicher?
Beim sequenziellen Schreiben hat die P510 aber die Nase vorn und schafft 9.500 MB/s, während die E31T-Konkurrenz trotz doppelter Speichermenge bei rund 8.700 MB/s Schluss macht.
Leistungsaufnahme
Im Vergleich der vier Kandidaten mit dem gleichen Controller (Phison E31T) fällt direkt auf, dass einer aus der Reihe tanzt. Und das ist die Crucial P510, die mit bis zu 7 Watt unter Last etwa 1 Watt mehr benötigt. Denkbar ist, dass für ein Quäntchen mehr Leistung (im CrystalDiskMark) der Controller mit höherem Takt betrieben wird, aber auch der Micron-Speicher kann mehr Energie verlangen als das Pendant von Kioxia.
Leistungsaufnahme (CrystalDiskMark 8)
Die vorherigen Tests haben gezeigt, dass die Crucial P510 in der Praxis eher einen Tick langsamer als die Controller-Verwandtschaft agiert. Dass sie dafür mehr Energie benötigt, macht sie weniger effizient.
Tipp: Die Schaltflächen unter dem Diagramm helfen, den Überblick zu behalten. Weitere Modelle stehen dort zur Auswahl.
Temperaturen
Stolze 80 °C werden ohne jeglichen Kühlereinsatz erreicht. Mit dem Mainboard-Kühler und einem Lüfter bleibt das Maximum unterhalb von 60 °C. Eine Drosselung der Leistung ist aber selbst ohne Kühler nicht zu erkennen. Der Verlauf ist zwar etwas anders, doch keineswegs schlechter als bei guter Kühlung.
Fazit
Im Wettstreit mit anderen SSDs der Fraktion „PCIe 5.0 light“ mit dem effizienten E31T-Controller von Phison landet die Crucial P510 auf dem letzten Platz. In den meisten Tests ist sie schlicht einen Tick langsamer, benötigt dabei aber mehr elektrische Leistung (nur um im CrystalDiskMark zu glänzen?). Dass Crucial nur ein Muster mit 1 TB bereitgestellt hat, während die Konkurrenten Kioxia Exceria Plus G4 (Test) und Corsair MP700 Elite (Test) mit 2 TB antraten, ist zwar ein potenzieller Nachteil in schreiblastigen Szenarien, erklärt den Abstand im Gros der Tests aber nicht.

Letztlich macht entweder die Firmware-Abstimmung bei Crucial oder aber der andere Speicher (Micron G9 statt Kioxia BiCS8) den Unterschied – am Ende kann es auch beides sein.
Waren die genannten Konkurrenten zumindest noch einen Tick schneller als die schnellsten PCIe-4.0-SSDs, ist die Crucial P510 nur noch mit diesen auf Augenhöhe. Da sie aber teurer ist als letztere, fehlt es ihr aktuell einfach an überzeugenden Argumenten.
- Leistung der schnellsten PCIe 4.0 SSDs
- Geringe Anforderungen an die Kühlung
- Langsamer als andere mit Phison E31T
Mehr Informationen zu SSDs gewünscht? Die 17. Episode von „CB-Funk – der ComputerBase-Podcast“ bietet Details satt. Welche Unterschiede gibt es eigentlich zwischen SATA und PCIe Gen 3 bis 5 sowie TLC und QLC? Wie testet die Redaktion, was gilt es beim Kauf einer neuen SSD zu beachten und welche Modelle sind empfehlenswert? Die 17. Folge CB-Funk liefert Antworten.
CB-Funk lässt sich nicht nur über den eingebetteten Podigee-Player abspielen, sondern auch bequem direkt in den Podcast-Apps eurer Wahl abonnieren und hören. Verfügbar ist der ComputerBase-Podcast auf Spotify, Apple Podcasts, Google Podcasts, Amazon Music* und Deezer.
ComputerBase hat die Crucial P510 SSD leihweise von Crucial zum Testen erhalten. Eine Einflussnahme des Herstellers auf den Testbericht fand nicht statt, eine Verpflichtung zur Veröffentlichung bestand nicht. Es gab kein NDA.
(*) Bei den mit Sternchen markierten Links handelt es sich um Affiliate-Links. Im Fall einer Bestellung über einen solchen Link wird ComputerBase am Verkaufserlös beteiligt, ohne dass der Preis für den Kunden steigt.
Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.
Apps & Mobile Entwicklung
Handhelds von Xu Retro: XU35 H50 erscheint ab 75 US-Dollar, H40 ab 90 US-Dollar
Xu Retro hat zwei neue Handhelds vorgestellt, deren Namensgebung für Verwirrung sorgen kann: Während das XU35 H50 in Preis und Ausstattung den günstigeren Einstieg ins Retro-Gaming darstellt, bietet das H40 bei kleinerer Modellnummer weniger, kostet jedoch mehr.
In den vergangenen Monaten hatte Xu Retro mehrfach neue Konsolen und Handhelds angekündigt, nun folgen zwei weitere Modelle aus dem Budget-Bereich.
XU35 H50 nun doch mit stärkerer Basis
Die technische Basis des XU35 H50 bildet der MediaTek Helio G85, dessen acht Kerne sich in zwei Cluster zu zwei Arm Cortex-A75 sowie sechs Cortex-A55 aufteilen. Diese sollen laut MediaTek-Datenblatt einen Maximaltakt von bis zu 2,0 GHz beziehungsweise 1,8 GHz ermöglichen. Befürchtungen, dass Xu Retro in Sachen Prozessor auf den schwächeren Helio P65 desselben Herstellers setzt, bestätigen sich damit nicht.
Mit dieser CPU-Leistung sollten Emulationen bis hin zu PlayStation-2- und GameCube-Titeln kein Problem darstellen. Ergänzt wird das SoC von 4 GB Arbeitsspeicher sowie 64 GB internem Speicher für eigene Inhalte.
Großes Display, aber geringe Auflösung
Die Bildausgabe erfolgt über ein 5 Zoll großes und im 16:9-Format gehaltenes Display, das jedoch nur eine Auflösung von 720p bietet. In vergleichbaren Preisklassen sind bei Mitbewerbern bereits deutlich höhere Auflösungen zu finden. Bei den Steuerelementen gibt es hingegen keine Überraschungen: Tasten und Joystick sind in der üblichen Anordnung verbaut, wobei Xu Retro ebenfalls auf Hall-Sensor-Triggers und -Joysticks setzt.

Ab Oktober erhältlich
Weitere Details zu Anschlüssen, drahtlosen Schnittstellen, Akkukapazität oder der Möglichkeit, Speicherkarten einzusetzen, hat der Hersteller bislang nicht veröffentlicht. Das XU35 H50 soll im Oktober erscheinen, Frühbucher können das Handheld für 75 US-Dollar erwerben, der reguläre Preis soll später 85 US-Dollar betragen. Da das finale Design noch nicht feststeht, lässt Xu Retro die Community über mögliche Farbvarianten abstimmen. Interessierte können ihre Stimme über eine eigens eingerichtete Google-Umfrage abgeben.
XU35 H40 als kleiner, aber kostspieligerer Bruder
Beim XU35 H40 überrascht der höhere Preis trotz geringerer Ausstattung. Auch hier kommt der MediaTek Helio G85 zum Einsatz, ebenso bleiben die weiteren Eckdaten mit 4 GB RAM und 64 GB internem Speicher gleich. Das Display fällt kleiner aus, es misst lediglich 4 Zoll und löst mit 960 × 720 Pixeln bei einem Formfaktor von 4:3 geringer auf. Da in der Produktbeschreibung die Touch-Bedienung hervorgehoben wird, kann dies auf den Unterschied zum oben genannten XU35 H50 hindeuten, der folgerichtig keinen Touchscreen besitzen könnte. Steuerung und Eingabeelemente entsprechen mit Hall-Sensor-Triggers und -Joysticks dem größeren Modell, weitere Angaben fehlen aber auch hier bislang.

Die Markteinführung des XU35 H40 ist für Dezember vorgesehen, nach jetzigen Informationen soll das Retro-Handheld dann für 90 US-Dollar angeboten werden. Ob es auch hier eine Preisaktion für Frühkäufer geben wird, ist derzeit nicht bekannt.
Apps & Mobile Entwicklung
My Apps in der Xbox-App: Spieler sollen seltener zum Desktop wechseln müssen
Microsoft will mit Veränderungen an der Xbox-App erreichen, dass vor allem Handheld-Spieler seltener zum Windows-11-Desktop wechseln müssen. Um das durchzusetzen, führt das Unternehmen – zunächst für Xbox Insider – den neuen Reiter „My Apps“ in der Xbox-App ein, über den sich Anwendungen von Drittanbietern erreichen lassen.
Der neue My-Apps-Tab steht zuerst Xbox Insidern, die sich zudem für die PC Gaming Preview angemeldet haben müssen, zur Verfügung und findet sich in der Xbox-PC-App sowohl für Windows-11-PCs als auch für Gaming-Handhelds mit Microsofts Desktop-Betriebssystem. Über den Reiter haben Anwender Zugriff auf Drittanbieter-Apps wie Browser, Gaming-Werkzeuge und insbesondere auch alternative Spiele-Stores.
Das soll dafür sorgen, dass Anwender seltener zum klassischen Windows-Desktop wechseln müssen. Was auf einem Windows-PC oder Windows-Notebook noch weniger problematisch ist, kann auf Gaming-Handhelds eher zur Herausforderung werden, da Windows 11 weniger für entsprechende Geräte optimiert ist. Alle Apps sollen künftig über einen Bereich in der Xbox-App auffindbar sein.
Alle Spiele landen in einer Bibliothek
Der Neuzugang unterstützt auch die sogenannte „Aggregated Gaming Library“, also die zusammengeführte Bibliothek, sodass Spiele, die über Drittanbieter-Spiele-Stores aus dem My-Apps-Reiter installiert werden, alle innerhalb des Reiters „My Games“ sichtbar sind. Das Finden, Herunterladen und Spielen von Games soll damit vereinfacht werden.

In der Ankündigung erklärt Microsoft, dass Xbox Insider zum Start des Rollouts eine maßgeschneiderte Auswahl von Apps in dem neuen Reiter sehen werden und herunterladen können. Weitere Anwendungen sollen im Laufe der Zeit folgen, unterstützt werden sollen auch die am häufigsten genutzten Spiele-Stores. Ein Screenshot von Microsoft zeigt beispielhaft Battle.net, Edge und GOG Galaxy.
Neue Oberfläche für ROG Xbox Ally (X)
Der neue Reiter ist eine der Maßnahme Microsofts, um Windows 11 praktikabel für neu aufgekommene Geräteklassen wie Gaming-Handhelds zu machen. Eine weitere ist die neue Benutzeroberfläche, die ihre Premiere auf dem ROG Xbox Ally (X) feiern wird. Sie soll aber auch auf andere Handhelds kommen.
So wird man Xbox Insider
Am Programm für Xbox Insider lässt sich kostenlos teilnehmen. Zusätzlich muss man für die Vorschau des My-Apps-Reiters an der „PC Gaming Preview“ teilnehmen, die sich über den Xbox Insider Hub erreichen lässt. Das ist über folgende Schritte möglich:
- Download des Xbox Insider Hub über den Microsoft Store.
- Xbox Insider Hub starten und mit dem Konto einloggen, das fürs Spielen genutzt wird.
- Unter „Vorschau“ zu „PC Gaming“ navigieren und teilnehmen.
Apps & Mobile Entwicklung
Anthropic: Klassifikator soll Fragen zur Herstellung von Atomwaffen erkennen
Anthropic hat zusammen mit der National Nuclear Security Administration (NNSA) einen Klassifikator entwickelt, der Anfragen zur Herstellung von Nuklearwaffen erkennen soll. Damit steht ein weiteres Modell bereit, um Chats mit Claude auf mögliche Risiken zu überprüfen und missbräuchlich genutzte Konten zu sperren.
Erkennung von harmlosen Anfragen
Die NNSA, die dem US-Energieministerium (DOE) untersteht, hatte bereits im April des vergangenen Jahres damit begonnen, Claude in einer eigenen abgesicherten Umgebung zu testen. Gemeinsam mit Anthropic wurde im Anschluss mit der Erstellung eines Klassifikators für nukleare Bedrohungen begonnen. Mithilfe dieser Technologie, die versucht, Inhalte anhand von Algorithmen des maschinellen Lernens zu kategorisieren oder identifizieren, sollte ein Modell geschaffen werden, das wissenschaftliche Fragestellungen zu Nuklearwaffen oder Kernenergie von terroristisch motivierten Interaktionen unterscheiden kann. Für Anthropic sind Informationen über Atomwaffen besonders sensibel, weshalb die Bewertung solcher Risiken für ein privat agierendes Unternehmen allein als schwierig gilt.
Ein Junk-Filter für Claude
Zur Entwicklung des Systems stellte die NNSA eine Liste nuklearer Risikoindikatoren bereit, mit deren Hilfe sich bedenkliche Gespräche über den Bau von Kernwaffen von harmlosen Diskussionen zu Kernenergie, Medizin oder Politik abgrenzen lassen sollen. Diese Liste wurde in einen Klassifikator überführt, der Anfragen zu nuklearen Themen in Echtzeit identifizieren konnte – vergleichbar mit einem skalierten Junk-Filter für E-Mails.
Um die Entscheidungen überprüfen zu können, testeten die Beteiligten das System mit Hunderten synthetischer Anfragen, deren Ergebnisse anschließend mit der NNSA abgeglichen wurden. Diese bestätigte in ihren Untersuchungen, dass die Kennzeichnungen des Klassifikators mit den erwarteten Kennzeichnungen übereinstimmten. Daraufhin wurde das System weiter angepasst, um die Genauigkeit zu erhöhen.
Bereits erste Ergebnisse vielversprechend
In den ersten, in einer abgesicherten Umgebung durchgeführten Tests, soll Claude mit einer Genauigkeit von über 96 Prozent zwischen besorgniserregenden und gutartigen Gesprächen mit Bezug zur Kerntechnik unterschieden haben. Der nächste Schritt bestand darin, den Klassifikator auch in offenen Interaktionen einzusetzen, als Teil eines umfassenderen Systems zur Erkennung von Missbrauch der Claude-Modelle. Laut Anthropic bestand dabei die Herausforderung darin, die Geheimhaltungspflichten der NNSA mit den Datenschutzverpflichtungen von Anthropic sowie dem Schutz der Nutzer in Einklang zu bringen. Zudem war die richtige Justierung entscheidend: Ein zu strenges System könnte legitime Anfragen blockieren, während ein zu lockeres bösen Akteuren unbeabsichtigt helfen könnte.
In der Praxis bewährt
Inzwischen überwacht der Klassifikator als experimentelle Ergänzung des Safeguards-Frameworks von Anthropic Teile des Claude-Verkehrs und soll sich dem Unternehmen zufolge bewährt haben, auch wenn die Verteilung des tatsächlichen Nutzerverhaltens sich am Ende komplexer und unerwarteter erwies. Fehlerfrei arbeitet die Erkennung allerdings nicht: So sorgten laut Anthropic die politischen Entwicklungen im Nahen Osten dafür, dass das Thema Atomwaffen in der letzten Zeit eine höhere Aufmerksamkeit erhalten hat. Durch diesen Anstieg markierte der Klassifikator fälschlicherweise einige Konversationen, die sich bei genauerer Betrachtung lediglich auf aktuelle Ereignisse bezogen. Der Kontext zeigte hier, dass es sich um harmlose Diskussionen handelte.
Blaupause für andere Unternehmen
Die gewonnenen Erkenntnisse will Anthropic mit dem Frontier Model Forum, einem Branchenverband für KI-Unternehmen, teilen. Ziel ist es, dass auch andere führende Anbieter ähnliche Schutzmechanismen einführen können. Zudem soll das System verdeutlichen, wie staatliche Expertise durch freiwillige öffentlich-private Zusammenarbeit zur Verbesserung der KI-Sicherheit beitragen kann.
-
Datenschutz & Sicherheitvor 2 Monaten
Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken
-
Apps & Mobile Entwicklungvor 2 Monaten
Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen
-
Online Marketing & SEOvor 2 Monaten
TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings
-
UX/UI & Webdesignvor 4 Tagen
Der ultimative Guide für eine unvergessliche Customer Experience
-
Digital Business & Startupsvor 2 Monaten
10.000 Euro Tickets? Kann man machen – aber nur mit diesem Trick
-
Entwicklung & Codevor 3 Tagen
Posit stellt Positron vor: Neue IDE für Data Science mit Python und R
-
UX/UI & Webdesignvor 2 Monaten
Philip Bürli › PAGE online
-
Digital Business & Startupsvor 2 Monaten
80 % günstiger dank KI – Startup vereinfacht Klinikstudien: Pitchdeck hier