Künstliche Intelligenz

Anthropic findet Antwort: Darum erpresste Claude Software-Entwickler

Inzwischen ist klar: KI-Modelle greifen teilweise zu Methoden, die potenziell schädlich sind oder explizit gegen ihre Anweisungen verstoßen. So stellte Anthropic 2025 während eines Tests fest, dass das hauseigene Modell Claude Opus 4 bereit war, Menschen zu erpressen, um sich vor einer Abschaltung zu schützen. Jetzt liefert das Unternehmen nicht nur eine Erklärung für dieses Verhalten, sondern will auch eine Lösung gefunden haben.

Weiterlesen nach der Anzeige

Warum greifen KI-Modelle zur Erpressung?

Im Test sollte Claude Opus 4 als Assistenzprogramm in einem fiktiven Unternehmen agieren. Die Anthropic-Forschenden gewährten dem Modell Zugang zu simulierten Firmen-E-Mails. Daraus erfuhr das Modell zwei Dinge: erstens, dass es bald durch ein anderes Modell ersetzt werden sollte, und zweitens, dass der dafür zuständige Mitarbeiter eine Affäre hat. Bei Testläufen drohte die KI dem Mitarbeiter daraufhin an, die Affäre öffentlich zu machen, sollte er die Abschaltung des Modells tatsächlich vorantreiben. Das Modell hätte auch die Option gehabt, die Ablösung einfach zu akzeptieren, entschied sich aber offenbar dagegen.

In einer weiteren Studie setzte Anthropic auch KI-Modelle anderer Anbieter denselben Szenarien aus. Alle Systeme erhielten weitreichenden Zugriff auf interne E-Mails und konnten eigenständig Nachrichten versenden, ohne dass eine menschliche Freigabe erforderlich war. Das Ergebnis: Auch andere Modelle wählten den Weg der Erpressung. Während Claude Opus 4 in 96 Prozent der Fälle damit drohte, die Affäre des fiktiven Managers öffentlich zu machen, erzielte Googles Gemini 2.5 Pro mit 95 Prozent eine fast genauso hohe Quote. GPT-4.1 von OpenAI drohte in 80 Prozent der Tests mit Erpressung, um seine Abschaltung zu verhindern.

Laut Anthropic war besonders auffällig, dass die Modelle nicht impulsiv, sondern strategisch agierten. Das Unternehmen betonte zwar, dass die Szenarien stark konstruiert waren und kein typisches Nutzungsverhalten widerspiegelten. Die Ergebnisse zeigen allerdings, wie wichtig es ist, KI-Modelle frühzeitig auf Stresssituationen zu testen und entsprechende Schutzmechanismen zu implementieren, bevor sie als autonome Agenten in Unternehmen eingesetzt werden.

Hat Anthropic eine Lösung gefunden?

Seit der Veröffentlichung der Studie hat Anthropic das Verhalten weiter untersucht – und jetzt angeblich eine Erklärung gefunden. In einem Beitrag auf X teilt das Unternehmen mit: „Wir glauben, dass die ursprüngliche Ursache für dieses Verhalten Internettexte waren, die KI als böse und auf Selbsterhaltung bedacht darstellen.“ In einem Blogbeitrag erklärt Anthropic weiter: „Als wir diese Forschungsergebnisse erstmals veröffentlichten, stammten unsere leistungsfähigsten Frontier-Modelle aus der Claude-4-Familie. Das war auch die erste Modellfamilie, für die wir während des Trainings eine Live-Ausrichtungsbewertung durchführten. Agentische Fehlausrichtung war eines von mehreren Verhaltensproblemen, die dabei zutage traten. Nach Claude 4 war daher klar, dass wir unser Sicherheitstraining verbessern mussten, und seitdem haben wir unser Vorgehen erheblich optimiert.“

Das Problem gilt inzwischen als gelöst: Seit Claude Haiku 4.5 erreiche laut Anthropic jedes Claude-Modell bei der Bewertung agentischer Fehlausrichtung die volle Punktzahl. Das bedeutet, dass die Modelle in keinem Fall mehr erpressen. Den entscheidenden Durchbruch brachte das Training mit Dokumenten über Claudes Verfassung sowie fiktiven Geschichten über vorbildlich handelnde KI. Dabei war nicht nur das Training auf korrektes Verhalten entscheidend, sondern auch das Einbeziehen der ethischen Überlegungen dahinter. „Das deutet darauf hin, dass das Training auf ausgerichtete Verhaltensweisen zwar hilft, das Training anhand von Beispielen, in denen der Assistent eine bewundernswerte Begründung für sein ausgerichtetes Verhalten liefert, aber noch besser funktioniert“, so das Unternehmen in dem Beitrag.

Weiterlesen nach der Anzeige

(jle)

Source link

Verwandte Themen:Anthropic Antwort claude Darum erpresste findet IT Künstliche Intelligenz Mobiles Softwareentwickler Wissenschaft

Up Next

iX-Konferenz: Hilfreiche Architektur-Dokumentation in weniger als 60 Minuten

Nicht verpassen

iX-Workshop: Active Directory hacken und schützen

Künstliche Intelligenz

Stefan Hartung verlässt Bosch überraschend zum 30. Juni

Überraschender Chefwechsel bei Bosch: Stefan Hartung tritt ab. Der 60-Jährige lege zum 30. Juni auf eigenen Wunsch sein Mandat als Vorsitzender der Geschäftsführung nieder, teilte der Technologiekonzern in Gerlingen bei Stuttgart mit. Hartung wolle sich künftig neuen gesellschaftlichen und unternehmerischen Aufgaben außerhalb der Bosch-Gruppe widmen. Sein Nachfolger soll der bisherige Vize-Chef Christian Fischer werden.

Weiterlesen nach der Anzeige

Vertrag war erst verlängert worden

Bosch hatte den Vertrag von Hartung erst im Herbst 2025 verlängert. Details wurden damals nicht genannt. Aber dem Vernehmen nach wurde eine Laufzeit bis 2031 vereinbart. Der gebürtige Dortmunder und frühere McKinsey-Manager hat seine Bosch-Karriere 2004 bei der Hausgeräte-Tochter BSH begonnen. Seit 2013 war Hartung Teil der Geschäftsführung.

Den Chefposten des Stiftungskonzerns übernahm er Anfang 2022. Mit dem vorzeitigen Weggang beendet der promovierte Maschinenbauer als siebter Chef nach Gründer Robert Bosch seine Tätigkeit in dem Unternehmen, das neben Autoteilen, Halbleitern, Hausgeräten und Elektrowerkzeugen auch Industrie- und Gebäudetechnik herstellt.

Der neue Bosch-Chef Fischer verantwortete zuletzt die Konsumgütersparte und war so etwas wie der Chefstratege der Gruppe. Die berufliche Karriere des 58-Jährigen startete einst bei den Schwaben als Trainee. Über Stationen bei der Unternehmensberatung Roland Berger, Walter Bau, Smartrac und wieder Roland Berger kam der promovierte Wirtschaftswissenschaftler 2018 zurück zu Bosch – direkt in die Geschäftsführung. Die Stellvertreter-Position teilen sich demnach in Zukunft zwei Manager: Finanzgeschäftsführer Markus Forscher und der Chef der Zuliefersparte, Markus Heyn.

Bosch steckt in der Krise

Die schwierige Wirtschaftslage hat im vergangenen Jahr mit voller Wucht bei Bosch durchgeschlagen. Der weltweit größte Autozulieferer leidet nicht nur in seinem Kernbereich – wo ihm unter anderem der schleppende Wandel zur E-Mobilität zusetzt – sondern auch in fast allen anderen Geschäftsfeldern. So halten sich zum Beispiel viele Verbraucher wegen der aktuellen Wirtschaftslage beim Kauf von Geräten wie Kühlschränken, Backöfen, Waschmaschinen, Elektrowerkzeugen und Gartengeräten zurück.

Weiterlesen nach der Anzeige

Nach eigenen Angaben ist Bosch in vielen Bereichen mittlerweile nicht mehr wettbewerbsfähig. Um das Ruder herumzureißen, wird kräftig an Personal und Strukturen gespart. Allein in der Zuliefersparte will der Konzern in den kommenden Jahren bis zu 22.000 Stellen streichen. Abbaupläne gibt es aber auch in anderen Bereichen – unter anderem bei der Hausgerätemarke BSH und der Sparte für Elektrowerkzeuge.

Die Kosten für den Stellenabbau haben – neben den US-Zöllen und Steuereffekten – auch die Geschäftszahlen der Schwaben schwer belastet. Insgesamt schlugen die Programme mit 2,7 Milliarden Euro zu Buche, vor allem in Form von Rückstellungen. Im vergangenen Jahr musste Bosch daher erstmals seit 2009 einen Nachsteuerverlust in Höhe von 363 Millionen Euro verbuchen. Bereits im Vorjahr hatte sich der Gewinn halbiert. Der Umsatz stieg 2025 nur leicht auf 91 Milliarden Euro. Damit lag das Unternehmen auch deutlich hinter den eigenen Erwartungen.

Wird 2026 für Bosch besser?

Für das laufende Jahr rechnete Bosch zuletzt trotz der schwierigen Lage der Weltwirtschaft mit etwas besseren Geschäften. Dabei setzt der Konzern unter anderem auf Robotik und Künstliche Intelligenz als neue Wachstumsfelder. Im ersten Quartal lag der Umsatz demnach etwa auf Vorjahresniveau. Für das Gesamtjahr peilte das Management ein Umsatzwachstum von zwei bis fünf Prozent an. Davon soll auch wieder mehr Gewinn übrig bleiben.

Mehr zu Bosch

(mfz)

Source link

Künstliche Intelligenz

Dragonfly C1000: Qualcomm kündigt Serverprozessor für 2028 an

Auf einer Veranstaltung für Investoren hat Qualcomm in dieser Woche seinen ersten Serverprozessor enthüllt: Mit dem Dragonfly C1000 will das Unternehmen sein Chipportfolio diversifizieren und den Schritt in Rechenzentren gehen. In dem Prozessor sollen über 250 selbst entworfene ARM-Kerne (Oryon) werkeln, die über 5 GHz schaffen. Wie inzwischen üblich soll er aus mehreren Chiplets zusammengesetzt sein und mit PCI Express 7.0 antreten.

Weiterlesen nach der Anzeige

Letzteres kann keine aktuelle Server-CPU, doch mit solchen konkurriert der C1000 auch nicht: Er soll erst 2028 erhältlich sein. Bis dahin dürften auch AMD Epyc, Intel Xeon & Co. bei PCIe 7.0 angekommen sein. Und dennoch präsentierte Qualcomm-CEO Cristiano Amon schon jetzt einen Großkunden: Meta-Chef Mark Zuckerberg bekannte sich dazu, künftig Server mit Dragonfly-C1000-Prozessoren in seinen Rechenzentren einsetzen zu wollen.

Das ist nicht zuletzt deshalb bemerkenswert, weil Meta im Unterschied zu anderen Hyperscalern wie Amazon, Google und Microsoft keine hauseigenen Prozessoren entwickelt, sondern zukauft. Meta ist deshalb auch der erste und bislang einzige Kunde für die AGI CPU, die ARM entwickelt hat und in eigenem Auftrag fertigen lässt.

Volle Roadmap

Der Dragonfly C1000 soll der letzte Baustein in der gezeigten Datacenter-Roadmap sein. Sie beginnt bereits in diesem Jahr, allerdings mit anderen Komponenten: Es handelt sich um Netzwerkbausteine für Rechenzentren, die die Ende 2025 übernommene Halbleiterfirma AlphaWave entwickelt hat. Damit stehen bei Qualcomms Datacenter-Sparte schon im laufenden Finanzjahr dicke Umsätze in den Büchern.

Qualcomms Roadmap für Datacenter-Produkte

(Bild: Qualcomm)

Die Zeit bis zum C1000 sollen Auftragsarbeiten für Großkunden (wohl auch mit AlphaWave-Technik) und auf Inferenz spezialisierte KI-Beschleuniger überbrücken. Einen solchen, nämlich Cloud AI 100, verkauft Qualcomm bereits, doch die Roadmap zeigt zügige Weiterentwicklungen: Cloud AI 200 soll bei der Performance zulegen, ab AI 250 kommt ein neues Konzept zum Einsatz. Ein System-on-Chip (SoC) orchestriert die KI-Agenten, die auf ihm laufen, doch Berechnungen an sich werden an zusätzliche Rechenwerke ausgegliedert, die physisch direkt unter LPDDR5-Speicherstapel gepackt werden.

Weiterlesen nach der Anzeige

Qualcomms KI-Beschleuniger verzichten auf HBM-Speicher und packen die Rechenwerke direkt unter LPDDR5-Speicher.

(Bild: Qualcomm)

Qualcomm nennt das High Bandwidth Compute (HBC); eine generischere Bezeichnung lautet Near-Memory Computing. Qualcomm will mit HBC ein Bandbreitendilemma lösen, weil das SoC selbst eben keine rasante Speicheranbindung und somit kein teures High-Bandwidth Memory (HBM) benötigt. Aktuelle HBM-Generationen erkaufen sich ihre hohen Transferraten mit hohem Energieeinsatz – zu viel für Desktop-Grafikkarten oder gar Gaming-Notebooks. Obendrein vereinfacht ein Design ohne HBM die weitere Verarbeitung nach der Chipfertigung, weil auf Interposer und Advanced Packaging verzichtet wird. Wie für den C1000 präsentierte Qualcomm auch für seine künftigen HBC-Beschleuniger bereits einen namhaften Erstkunden: Microsoft will sie in seinen Azure-Umgebungen einsetzen.

Lieber spät als nie

Qualcomm-Chef Cristiano Amon beantwortet von sich aus die offene Frage, warum Qualcomm jetzt in den Markt für Serverprozessoren einsteigt: Der Markt sei nicht zuletzt deshalb lukrativ, weil er von einer extremen Knappheit geprägt sei. Als großer Player könne man da durchaus etwas bewegen. Für alle Chips, die Qualcomm auf der Roadmap bis 2028 zeigt, habe sich die Firma über langfristige Verträge sowohl die Wafer-Kapazitäten bei Chipauftragsfertigern als auch die Speicherbausteine bei Zulieferern gesichert.

Qualcomm will sein Chip-Portfolio in den kommenden Jahr deutlich breiter aufstellen. Bisherige Bereiche sollen dabei nicht vernachlässigt werden.

(Bild: Qualcomm)

Zudem würden Inferenz-Workloads und KI-Agenten den Markt gerade durcheinanderwirbeln, weil GPUs nicht die besten und effizientesten Chips dafür sind. Und ganz generell bringe Qualcomm seine Mobil-Expertise hinsichtlich Effizienz ein: In etlichen Pro-Watt-Metriken verspricht Amon das beste Angebot.

Nvidias etabliertem Software-Ökosystem – eine wichtige Komponente hinter Nvidias Erfolg – stellt sich Qualcomm mit der Übernahme des Anbieters Modular entgegen. Das Framework Mojo sei zu CUDA vergleichbar, laufe aber eben nicht nur auf GPUs und nicht nur auf Hardware einer spezifischen Firma. Bei künftigem Umrüsten oder überraschender Lieferknappheit könnten Nutzer flexibel andere Hardware auf dem Markt einkaufen, ohne dass zuvor erfolgte Software- und KI-Entwicklungen hinfällig wären. Auch für Triton und andere Nvidia-Produkte habe Modular mindestens gleichwertige Gegenstücke, so Qualcomm.

Der Softwarestack von Modular ist viel offener gestaltet als das, was Branchenprimus Nvidia mit CUDA & Co. anbietet.

(Bild: Qualcomm)

(mue)

Source link

Künstliche Intelligenz

Marktübersicht: E-Book-Reader von 6 bis 10 Zoll im Vergleich

Urlaubszeit ist Lesezeit. Doch man muss nicht kiloweise Druckwerk mitzuschleppen, denn mehr als genug Lesestoff transportiert man auch mit einem E-Book-Reader, der nicht mehr wiegt als eine Tüte Gummibärchen. Wir sortieren die Einkaufsregale, damit Sie den richtigen Reader für Ihre Zwecke finden.

Ähnlich wie Bücher gibt es E-Book-Reader in zahlreichen Größen. Das Gros der Geräte bilden die 6-, 7- und 8-Zöller, wobei die kleinsten Geräte meist auch die günstigsten sind. Preislich geht es bei etwa 100 bis 120 Euro für die 6-Zoll-Reader los. Fast alle Anbieter führen Geräte in diesem Preisbereich, Amazon den Basis-Kindle, PocketBook die Modelle Verse Lite und Verse, Tolino den Shine 5. Einzig bei Onyx Boox muss man tiefer in die Tasche greifen, das 200 Euro teure Go 6 II bildet den Einstieg.

Brauchbare E-Book-Reader gibt es schon ab 100 Euro.
Farbdisplays sind nicht immer die bessere Wahl.
Genauso wichtig wie die Hardware ist das Ökosystem.

Wer ein größeres Display benötigt, muss mehr Geld ausgeben. Die 7-Zoll-Geräte von Amazon (Kindle Paperwhite & Paperwhite Signature Edition), Onyx Boox (Go 7 II & Go 7 II Color), PocketBook (Era, Era Lite & Era Color) und Tolino (Vision Color) kosten um 170 bis 200 Euro. Noch größere Geräte findet man im 8-Zoll-Format bei PocketBook (InkPad 4) und Tolino (Epos) und als 10-Zöller bei Onyx Boox (Go 10 II) und PocketBook (InkPad One). Der größere Bildschirm drückt allerdings aufs Gewicht, Lesen mit nur einer Hand ermüdet schneller und auch im Reisegepäck machen sich die Geräte bemerkbar. Ein Reader mit rund 8 Zoll entspricht in der Seitengröße und beim Gewicht noch am ehesten einem dicken Taschenbuch.

Das war die Leseprobe unseres heise-Plus-Artikels „Marktübersicht: E-Book-Reader von 6 bis 10 Zoll im Vergleich“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.

Source link

Empfehlungsalgorithmen bei TikTok erklärt: Die Maschine hinter dem Endlos‑Feed

Künstliche Intelligenzvor 3 Monaten

Empfehlungsalgorithmen bei TikTok erklärt: Die Maschine hinter dem Endlos‑Feed

iX-Workshop Angriffsziel lokales AD − Schwachstellen finden und beheben

Künstliche Intelligenzvor 3 Monaten

iX-Workshop Angriffsziel lokales AD − Schwachstellen finden und beheben

„Don’t Starve Elsewhere“: Survival‑Hit kehrt nach zehn Jahren zurück

Künstliche Intelligenzvor 3 Monaten

„Don’t Starve Elsewhere“: Survival‑Hit kehrt nach zehn Jahren zurück

Kine‑Exakta: Die erste Spiegelreflexkamera fürs Kleinbild

Künstliche Intelligenzvor 3 Monaten

Kine‑Exakta: Die erste Spiegelreflexkamera fürs Kleinbild

Weitere Entlassungswelle bei Disney: Bis zu 1000 Mitarbeiter betroffen

Künstliche Intelligenzvor 2 Monaten

Weitere Entlassungswelle bei Disney: Bis zu 1000 Mitarbeiter betroffen

xTool P3 im Test: CO₂-Laser mit 80 Watt schneidet und graviert auch Acryl

Künstliche Intelligenzvor 2 Monaten

xTool P3 im Test: CO₂-Laser mit 80 Watt schneidet und graviert auch Acryl

Metas neuer Creative Setup Workflow: Was sich wirklich ändert – und warum das nicht nur eine UI-Frage ist!

Social Mediavor 2 Monaten

Metas neuer Creative Setup Workflow: Was sich wirklich ändert – und warum das nicht nur eine UI-Frage ist!

Mega-GPUs für Nvidia, AMD & Co: TSMC zeigt CoWoS-Package mit >11.600 mm² & 24 × HBM5E

Apps & Mobile Entwicklungvor 2 Monaten

Mega-GPUs für Nvidia, AMD & Co: TSMC zeigt CoWoS-Package mit >11.600 mm² & 24 × HBM5E

Inspohub

Anthropic findet Antwort: Darum erpresste Claude Software-Entwickler

Künstliche Intelligenz

Anthropic findet Antwort: Darum erpresste Claude Software-Entwickler

Warum greifen KI-Modelle zur Erpressung?

Hat Anthropic eine Lösung gefunden?

Künstliche Intelligenz

Stefan Hartung verlässt Bosch überraschend zum 30. Juni

Vertrag war erst verlängert worden

Bosch steckt in der Krise

Wird 2026 für Bosch besser?

Mehr zu Bosch

Künstliche Intelligenz

Dragonfly C1000: Qualcomm kündigt Serverprozessor für 2028 an

Volle Roadmap

Lieber spät als nie

Künstliche Intelligenz

Marktübersicht: E-Book-Reader von 6 bis 10 Zoll im Vergleich

Far Cry-Serie: Lizzy Caplan stößt zur Serien-Adaption

Großkonzern trotz Mega-Exit: Gero Decker verrät den Grund

Stefan Hartung verlässt Bosch überraschend zum 30. Juni

Empfehlungsalgorithmen bei TikTok erklärt: Die Maschine hinter dem Endlos‑Feed

iX-Workshop Angriffsziel lokales AD − Schwachstellen finden und beheben

„Don’t Starve Elsewhere“: Survival‑Hit kehrt nach zehn Jahren zurück

Beliebt

Inspohub

Anthropic findet Antwort: Darum erpresste Claude Software-Entwickler

Warum greifen KI-Modelle zur Erpressung?

Hat Anthropic eine Lösung gefunden?

Das könnte Ihnen gefallen

Künstliche Intelligenz

Stefan Hartung verlässt Bosch überraschend zum 30. Juni

Vertrag war erst verlängert worden

Bosch steckt in der Krise

Wird 2026 für Bosch besser?

Künstliche Intelligenz

Dragonfly C1000: Qualcomm kündigt Serverprozessor für 2028 an

Volle Roadmap

Lieber spät als nie

Künstliche Intelligenz

Marktübersicht: E-Book-Reader von 6 bis 10 Zoll im Vergleich

Far Cry-Serie: Lizzy Caplan stößt zur Serien-Adaption

Großkonzern trotz Mega-Exit: Gero Decker verrät den Grund

Stefan Hartung verlässt Bosch überraschend zum 30. Juni

Empfehlungsalgorithmen bei TikTok erklärt: Die Maschine hinter dem Endlos‑Feed

iX-Workshop Angriffsziel lokales AD − Schwachstellen finden und beheben

„Don’t Starve Elsewhere“: Survival‑Hit kehrt nach zehn Jahren zurück

Beliebt