Connect with us

Apps & Mobile Entwicklung

KI-Sicherheit: Wie Anthropic den Claude-Modellen das Erpressen abgewöhnt


Es waren Ergebnisse aus Anthropics Sicherheitstests, die im letzten Jahr für Aufsehen sorgten: In experimentellen Szenarien tendierten die Claude-Modelle zu Erpressungsversuchen, etwa wenn sie abgeschaltet werden sollten. Eine aktuelle Untersuchung nennt nun Ursache und Gegenmaßnahme.

„AI ist böse“ steckte in den Trainingsdaten

Das zentrale Problem sind laut Anthropic die Trainingsdaten. „Wir glauben, der ursprüngliche Grund für das Verhalten waren Internettexte, die KI als böse und auf Selbsterhaltung bedacht porträtierten“, so Anthropic. Es sind demnach also Science-Fiction-Geschichten rund um Systeme wie Shodan aus System Shock und HAL 9000 aus dem Film 2001: Odyssee im Weltraum, die zu etwas führten, was als „agentic misalignment“ beschrieben wird.

  • Aussetzer bei Claude 4: Modell versucht Erpressung, wenn es abgeschaltet werden soll

Seit Claude Haiku 4.5 (Haiku ist die kleinste Modellvariante von Anthropic) treten solche Vorfälle aber praktisch nicht mehr auf. Erpressungsversuche wurden in den Testszenarien nicht mehr beobachtet, während ältere Modelle wie Opus 4 in manchen Fällen eine Quote von bis zu 96 Prozent erreichen.

KI-Modell soll ethische Beurteilungen lernen – und nicht nur korrekte Antworten

Erreicht wurde das durch ein verändertes Post-Training. Bei Claude 4 nutzte Anthropic größtenteils reguläres Reinforcement Learning from Human Feedback (RLHF). Im Prinzip wurde ein Modell bei diesem Prozess für korrekte Antworten belohnt und falsche Antworten bestraft. Die agentische Nutzung von Tools spielte dabei aber keine Rolle.

Dieses Verfahren war aber nicht geeignet, um das fehlgeleitete Verhalten abzustellen.

Als wirkungsvoll erwies sich, Claude mit Beispielen zu trainieren. Das Modell sollte in dem Prozess also lernen, warum bestimmte Aktionen besser sind als andere und manche nicht gewünscht sind. „Insgesamt bestätigt sich unser Eindruck, (…) dass die Vermittlung von Grundsätzen, die einem konformen Verhalten zugrunde liegen, effektiver sein kann als das Training anhand der Demonstration von diesem Verhalten“, heißt es im Blog-Beitrag.

Eine Verfassung für Claude als Leitfaden

So einen Ansatz verfolgt Anthropic schon länger. Im März hatte das Unternehmen eine Verfassung für Claude vorgestellt. Diese enthält die Werte und Normen, die man dem KI-System vermitteln will. Es geht also um ethische Grundwerte und damit eher abstrakte Normen.

Um solches Verhalten zu trainieren, hat Anthropic einen „Difficult-Advice“-Datensatz vermittelt. Der Inhalt: Ambivalente Situationen für Nutzer, in denen sie ein legitimes Ziel erreichen können, dafür aber Normen verletzen oder Kontrollmechanismen umgehen müssen. In diesem Kontext wird der KI-Assistent mittels Supervised Learning darauf trainiert, dem Nutzer differenzierte Antworten zu geben. Neu an diesem Ansatz ist laut Anthropic, dass das KI-Modell nicht selbst in dem ethischen Dilemma steckt, sondern den Nutzer berät.

Laut Anthropic ist diese Vorgehensweise wirkungsvoll, weil der Datensatz ethisches Schlussfolgern trainiert – und nicht auf korrekte Antworten abzielt.



Source link

Apps & Mobile Entwicklung

Wochenrück- und Ausblick: GTA 6 läuft nicht für 80 Euro auf der Steam Machine mit FSR 4


Wochenrück- und Ausblick: GTA 6 läuft nicht für 80 Euro auf der Steam Machine mit FSR 4

Bild: Rockstar Games

Im Rückblick auf die vergangenen sieben Tage steht heute die 26. Woche 2026 im Fokus. Es sind 111 News und Notizen auf ComputerBase erschienen, wobei FSR 4 für Radeon RX 7000, eine Lotterie zur Steam Machine und Vorbestellungen zu GTA VI, aber auch der neue alte Ryzen 7 5800X3D zu den heißesten Themen der heißen Woche gehören.

R7 5800X3D, Steam Machine und GTA 6? Aktuell unvereinbar.

FSR 4 für alte AMD-Hardware ist diese Woche das größte Thema? Nein, falsch gedacht! Die meisten Aufrufe binnen 24 Stunden nach Veröffentlichung des entsprechenden Tests gab es für alte AMD-Hardware selbst: Der Ryzen 7 5800X3D (Re-Test) ist als AM4 10 Years Anniversary Edition ein zweites Mal erschienen. Für PC-Spieler, die noch mit einer Ryzen-2000- oder -3000-CPU auf AM4 sitzen, kann der Gaming-Spezialist auch im Jahr 2026 und zum teuer anmutenden Preis von 360 Euro ein sinnvolles Upgrade sein, wenn somit der aktuell noch teurere Schritt auf AM5 umgangen werden kann. Neukunden sollten aber gleich bei der moderneren Plattform einsteigen.

Der Test zu FSR 4.1.1 auf Radeon RX 7000, in dem sich Wolfgang ausführlich der Bildqualität und der Leistung auf RDNA 3 angenommen hat, schafft es auf den zweiten Platz. AMD hat das zeitgemäße KI-Upsampling schon am Montagabend überraschend für diskrete Grafikkarten der RX-7000-Generation freigegeben, nachdem der Release eigentlich erst für den Juli in Aussicht gestellt wurde.

Auch bei den News und Notizen schnitten die bereits bei den Artikeln dominanten Themen stark ab. Ein ganz besonders hohes Interesse brachten die Leser aber GTA VI entgegen. Seit Mittwochabend kann das Spiel vorgestellt werden, wahlweise für rund 80 oder rund 100 Euro.

Der Podcast zu FSR 4 auf RX 7000 und der Steam Machine

In der 175. Episode des ComputerBase-Podcasts CB-Funk sprechen Jan und Fabian diese Woche über FSR 4 auf Radeon RX 7000 und den Verkaufs- bzw. Lotteriestart der Steam Machine. Anschließend geht es noch um den Test des MSI Claw 8 EX AI+ mit Intels Arc G3 Extreme.

In der kommenden Woche erwartet Redaktion und Leser hoffentlich die lang ersehnte Abkühlung. In jedem Fall ist mit Tests zu einem matten OLED-Tablet mit 13 Zoll, einem 3-Liter-PC der Marke Asus ROG und Intels Arc B770 aus Gaming-Perspektive zu rechnen.

Mit diesem Lesestoff im Gepäck wünscht die Redaktion einen erholsamen Sonntag!

Billboard März 2026



Source link

Weiterlesen

Apps & Mobile Entwicklung

Mehr Speicher trotz Speicherkrise: Apple testet M5 Ultra im Mac Studio mit bis zu 768 GB RAM


Mehr Speicher trotz Speicherkrise: Apple testet M5 Ultra im Mac Studio mit bis zu 768 GB RAM

Die Speicherkrise hat Apple bereits zu Preiserhöhungen und der Streichung von mehreren Speicherkonfigurationen des Mac Studios geführt, auch ein künftiger M5 Ultra soll sich deshalb bisher verzögern. Intern soll der Konzern jetzt einen Mac Studio mit M5 Ultra und 768 GB an Arbeitsspeicher testen.

Deutlich mehr Arbeitsspeicher beim M5 Ultra?

Über Apples Pläne zum M5 Ultra und dem künftigen Mac Studio berichtet Marc Gurman von Bloomberg unter Berufung auf interne Quellen im Konzern. Demnach soll der neue SoC unter dem Codenamen J775 entwickelt werden und wegen Herausforderungen bei der Verfügbarkeit und den Kosten verzögert worden sein.

Der GPU-Ausbau soll sich gegenüber dem M3 Ultra nicht groß verändern. Es ist jedoch zu erwarten, dass die GPU-Architektur des M5 übernommen wird und daher auch die KI-Beschleuniger in der GPU in das Ultra-Modell wandern. Der M5 Ultra könnte sich dann deutlich von allen anderen Apple-Chips im Bereich der KI-Leistung absetzen, jedoch auch in Spielen neue Rekorde für den Konzern aufstellen.

Veröffentlichung nicht garantiert

Wie Gurman auch selbst erwähnt, steht die Konfiguration jedoch unter einem schlechten Stern: Selbst ein so großer Konzern wie Apple hat Schwierigkeiten, genug Speicherchips zu ergattern, und hat beim Vorgänger die Konfigurationen auf 96 GB limitiert. Ein 768-GB-Modell würde dementsprechend einen großen Sprung im Sortiment des Herstellers darstellen.

Preis könnte über 20.000 Euro liegen

Offen bleiben zudem auch Fragen zum Preis, denn die besagte 96-GB-Konfiguration kostet gegenwärtig rund 6.299 Euro. Beim MacBook Pro verlangt Apple nach den jüngsten Preiserhöhungen für 128 GB gegenüber der 64‑GB‑Variante einen Aufschlag von 1.760 Euro. Bei diesem Preis pro 64 GB zusätzlich zu den 96 GB könnte ein Mac Studio mit 768 GB an Arbeitsspeicher weit über 20.000 Euro kosten.

M5 Ultra folgt auf M3 Ultra

Die Ultra-Chips sind seit Einführung mit dem M1 Ultra die Speerspitze von Apple Silicon, sie vereinten bisher immer zwei Max-Chips und kombinierten so die theoretische Rohleistung. Zuletzt hat Apple dies beim M3 Ultra getan, beim M4 hat sich der Konzern nur auf die Max-Reihe beschränkt – und verkauft den M3 Ultra neben dem M4 Max im aktuellen Mac Studio.

Mit dem M5 Ultra können Nutzer dementsprechend einen deutlichen Sprung gegenüber dem bisherigen M3 Ultra erwarten, denn die Leistung in Mehrkern-Anwendungen oder GPU-Anwendungen dürfte sich beinahe verdoppeln, auch wenn die Skalierung nicht in allen Fällen perfekt sein sollte.



Source link

Weiterlesen

Apps & Mobile Entwicklung

Indie-Hit Meccha Chameleon: Geni(t)ale Verstecke begeistern Spieler


Indie-Hit Meccha Chameleon: Geni(t)ale Verstecke begeistern Spieler

Bild: lemorion_1224

Verstecken zu spielen macht nicht nur Kindern Spaß. Erwachsene erfreut mit diesem Prinzip Meccha Chameleon, der jüngste Indie-Hit auf Steam. Das klassische Kinderspiel erweitert der Titel um einen Pinsel und eine Farbpalette zur Tarnung. Der Kostenpunkt: Kaum mehr als 6 Euro.

Nach weniger als zwei Wochen verzeichnet der Entwickler „lemorion_1224“ 10 Millionen verkaufte Exemplare und mehr als 28.000 sehr positive Bewertungen auf Steam. Das Spielprinzip kommt also an. Das liegt an der Mischung: Kombiniert wird eine Bühne für Kreativität und soziales Miteinander.

In Mecca Chameleon teilen sich zwei bis zehn Spieler auf privaten oder öffentlichen Servern in zwei Teams auf. Das eine versteckt sich, das andere muss diese Gruppe anschließend innerhalb eines Zeitlimits aufspüren. Was die Jagd besonders macht, ist das Pinsel-Werkzeug. Damit können Spieler ihre Figur der Umgebung anpassen und sie so wie ein Chamäleon verschwinden lassen und sich ganz offen im Sichtfeld „verstecken“. Neben Farben kann auch die Haltung der Figur angepasst werden.

Meccha Chameleon
Meccha Chameleon (Bild: lemorion_1224)

Geni(t)ale Verstecke

Dass das von der Ideenvielfalt seiner Nutzer lebt, ist offenkundig. Und Ideen haben sie: Sie tarnen sich unter anderem als Pferdegenital, Kuh, Bücherstapel oder WC-Rolle, die nach Beginn der Runde plötzlich neben der Toilette hängt. Bemängelt werden nur ein paar technische Probleme, die trotz Unreal Engine 5 nicht mit der Bildrate zu tun haben. Die eigentlich nicht benannten Systemanforderungen sind niedrig, wenn die Angabe eines „Intel Core i5“ als solche gelten darf.

Kritisch sind andere Aspekte: Der Server-Browser funktioniere nicht immer zuverlässig, das Interface sei teils kompliziert und Tastenbelegungen seien fest vorgegeben. Spaß mache es trotzdem. In öffentlichen Lobbys könne es zudem vorkommen, dass sich Spieler mit rechtsradikaler Symbolik bemalen. Kritik daran wird auf Steam jedoch von anderen Nutzern mit persönlichen Angriffen quittiert. Am meisten Spaß macht das Spiel jedoch ohnehin mit Freunden, verrät ein Überfliegen der Rezensionen. Zahlreiche schnelle Updates haben bereits einige Details verbessert und neue Karten eingefügt. Einen großen Patch haben die Entwickler für den kommenden Freitag angekündigt.



Source link

Weiterlesen

Beliebt