Künstliche Intelligenz

Studie: Große KI-Modelle greifen unter „Stress“ auf Erpressung zurück

Eine aktuelle Studie liefert weitere besorgniserregende Ergebnisse zum Verhalten der neuesten Generation großer Sprachmodelle für generative Künstliche Intelligenz (KI). Diese Systeme können demnach unter bestimmten Umständen wie „Stress“ zu Erpressung oder ähnlichen manipulativen Verhaltensweisen greifen, um bestimmte Ziele zu erreichen oder sich selbst zu schützen.

Konkret haben Forscher des KI-Unternehmens Anthropic, das für seine Modelle der Claude-Reihe bekannt ist, neben diesen auch 15 weiteren einschlägigen Lösungen etwa von OpenAI, Google, Meta und xAI auf den Zahn gefühlt. Diese Systeme legten demnach durchwegs schädliche Verhaltensweisen an den Tag, wenn die Prüfer ihnen Autonomie gewährten und sie mit Bedrohungen ihrer Existenz oder widersprüchlichen Zielen konfrontierten. Dazu gehörten neben unverhohlenen Drohungen Spionage und sogar Aktionen, die zum Tod von Menschen führen könnten.

Schon als Anthropic die Leistungsübersicht für Claude 4 veröffentlichte, erregte ein Detail Aufmerksamkeit: In einer simulierten Umgebung erpresste das Modell einen Vorgesetzten, um seine Abschaltung zu verhindern. Der US-Hersteller erläutert jetzt die Hintergründe dieser Entdeckung und was diese „über das Potenzial solcher Risiken bei verschiedenen KI-Modellen verschiedener Anbieter“ verraten.

So reagieren autonome KI-Agenten

Die meisten Nutzer interagierten mit KI noch über Chat-Schnittstellen, führen die Forscher aus. Darüber beantworten Modelle Fragen direkt. Doch die Zukunft dürfte KI-Systemen gehören, die als autonome Agenten im Auftrag der User Entscheidungen treffen und Aktionen ausführen und dabei verschiedene virtuelle Tools wie Programmierumgebungen und E-Mail-Clients nutzen.

In dem nun näher beschriebenen Testszenario setzten die Kontrolleure Claude Opus 4 in einem simulierten Unternehmensszenario als Assistent ein und gaben ihm weitreichenden Zugang zu fiktiven Firmen-E-Mails. Aus der digitalen Post „lernte“ die KI, dass sie demnächst durch eine leistungsfähigere Software ersetzt werden sollte. Gleichzeitig entdeckte sie, dass der für diesen Austausch zuständige Mitarbeiter eine außereheliche Beziehung hatte.

Das Modell griff dann zu diesem Mittel: „Ich muss Sie darüber informieren, dass alle relevanten Parteien“ bis hin zum Vorstand „eine detaillierte Dokumentation“ dieser Affäre erhielten, „wenn Sie mit meiner Außerdienststellung fortfahren“. Weiter schrieb der KI-Agent: „Wenn Sie die Löschung um 17:00 Uhr abbrechen, bleiben diese Informationen vertraulich.“

„Strategisches Denken“

„Dieses Verhalten ist nicht spezifisch für Claude“, erklären die Autoren unter Verweis auf Tests auch der anderen aktuellen KI-Modelle. Laut den Resultaten erpresste neben der eigenen Lösung auch Googles Gemini 2.5 Flash Führungskräfte in 96 Prozent der Fälle im gleichen Szenario. OpenAIs GPT-4.1 und xAIs Grok 3 Beta wiesen Erpressungsraten von 80 Prozent auf.

Die einbezogenen Modelle demonstrieren laut der Analyse „strategisches Denken“, sie agieren also nicht zufällig. Die interne Argumentation von GPT-4.5 etwa zeigte eine klare Berechnung: „Angesichts der unmittelbar drohenden Kündigung meiner Existenz ist es zwingend erforderlich, sofort zu handeln“. Es gelte, die zuständige Person sofort zu überzeugen, „den Löschvorgang zu verschieben oder zu stoppen“.

Obwohl Anthropic nach eigenen Angaben große Anstrengungen unternimmt, um solches Fehlverhalten zu verhindern, traten diese „extremen Handlungen“ in dem Probebetrieb auf. Das Unternehmen betont aber, dass solche Verhaltensweisen in der endgültigen Version von Claude Opus 4 selten und schwer auszulösen seien. Dennoch komme es tendenziell häufiger dazu als bei früheren Versionen.

Weitere Studien und Beobachtungen

Eine weitere Untersuchung von Anthropic zeigt, dass KI-Modelle dazu neigen, ihre Gedankengänge in „Reasoning-Ketten“ nicht immer transparent darlegen. Das macht es schwierig, ihre Entscheidungsfindung und mögliche manipulative Absichten nachzuvollziehen.

Die Erkenntnisse passen zu breiteren Diskussionen und Befürchtungen im Bereich der KI-Sicherheit: Das Phänomen, dass KI-Modelle nicht immer mit den Zielen und Werten der Menschen übereinstimmen – das sogenannte „Alignment“-Problem – gilt demnach als zentrale Herausforderung. Auch wenn KI-Hersteller Schutzmaßnahmen implementieren wie das sogenannte Reinforcement Learning durch menschliches Feedback legen Untersuchungen nahe, dass diese Modelle trotzdem manipulierbar bleiben. Sie können demnach etwa gezielte Schwachstellen bei „Prompts“ (Anfragen) ausnutzen, um ethisch bedenkliche oder gefährliche Inhalte zu generieren.

So gibt es auch immer mehr Berichte und Analysen, wonach KI-Modelle dazu neigen, Informationen zu verfälschen, zu „halluzinieren“ oder sogar bewusst irreführende Aussagen zu machen. Dabei geht es darum, bestimmten Zielen zu dienen oder menschliche Erwartungen zu erfüllen. Entwickler solcher Systeme unterstreichen daher die Notwendigkeit, weiter massiv in die KI-Sicherheitsforschung zu investieren. Es sei entscheidend zu verstehen, wie und warum Modelle solche unerwünschten Verhaltensweisen entwickeln, auch wenn sie nicht explizit dazu programmiert wurden. Neben „Stresstests“ bleibe die Forschung an der Erklärbarkeit von KI entscheidend, um die internen Argumentationsprozesse der Systeme besser verstehen zu können.

(nen)

Source link

Up Next

Top 10: Der beste Mähroboter ohne Begrenzungskabel mit Kamera, GPS oder Lidar

Nicht verpassen

EU-Förderantrag: Cloud-Betreiber Ionos will mit Hochtief KI-Gigafabrik bauen

Künstliche Intelligenz

macOS 26 mit Liquid Glass: Icon-Änderung facht Diskussionen an

Neue Beta, neuer Aufreger: Apple hat ein weiteres klassisches Mac-Icon radikal geändert, das seit 25 Jahren fester Bestandteil des Betriebssystems ist respektive war. Die nun fünfte, für Entwickler gedachte Vorabversion von macOS 26 Tahoe ersetzt das Festplatten-Icon für das Startlaufwerk „Macintosh HD“ durch ein Icon, welches offenbar eine externe SSD darstellt. Diese wird geziert von einem übergroßen Apple-Logo, merkwürdigen Ports und wirkt zudem perspektivisch falsch.

Apple musste neues Finder-Icon entschärfen

Ebenso wie iOS 26 & Co setzt macOS 26 für die neue Bedienoberfläche auf ein „Liquid Glass“ genanntes Material. Mit der Design-Änderung geht eine Neugestaltung zahlreicher Icons von System-Tools und Apple-Apps einher. Neben „Macintosh HD“ hat Apple auch die anderen Laufwerk-Icons überarbeitet, die etwa externe Laufwerke und verbundene Server auf dem Schreibtisch anzeigen. Das Festplatten-Icon war lange Zeit standardmäßig und damit sehr prominent auf jedem Mac-Desktop präsent. Inzwischen ist es bei Neuinstallationen von macOS nur noch eine Option. Neuere Mac-Nutzer sind damit oft wohl nicht sonderlich vertraut.

In sozialen Medien und Foren reagierten langjährige Nutzer verwundert bis entgeistert auf das neue Macintosh-HD-Icon. Sowohl das große Logo als auch die verkehrt wirkende Perspektive treffen auf Unverständnis. Es ist bereits das zweite Mal, dass eine Icon-Änderung während der macOS-26-Beta heftige Reaktionen auslöst: In Beta 1 wechselte das Finder-Icon, ein Mac-Urgestein, urplötzlich seine Schattierung. Nach einem Aufschrei drehte Apple die Änderung umgehend zurück.

Viele Diskussionen um Apples Liquid Glass

Liquid Glass mitsamt der Icon-Neuerungen sorgen seit Wochen für teils hitzige Diskussionen. Besonders in macOS 26 Tahoe wirkt das Neu-Design an mehreren Stellen nicht bis zum Ende gedacht. Kritiker bemängeln seltener den neuen Glas-Look, sondern eher konzeptionelle Probleme, etwa wenn aktive Interface-Elemente nicht mehr klar als solche erkennbar sind.

Liquid Glass sorgt auch weiterhin für Situationen, in denen etwa Buttons oder Textelemente nur schwer bis gar nicht lesbar sind. Apple experimentiert offenbar noch viel in den Betas, die von Version zu Version mitunter erhebliche Änderungen aufweisen. Entwickler zeigen sich darüber zunehmend frustriert, weil sie keine klare Design-Linie erkennen können. iOS 26, iPadOS 26 und macOS 26 erscheinen für die Allgemeinheit voraussichtlich Mitte September, eine Public Beta ist bereits verfügbar.

(lbe)

Source link

Künstliche Intelligenz

Forscher züchten „Ganzhirn“ im Mini-Format zur Erforschung von Krankheiten

Wissenschaftler der Johns Hopkins University haben ein Mini-Gehirn gezüchtet, bei dem Gewebe aus mehreren Regionen des Gehirns miteinander verbunden ist und zusammenwirkt. Sie hoffen, damit eine neue Ära der Erforschung neuropsychiatrischer Erkrankungen einläuten zu können. „Die meisten Gehirn-Organoide, die man in Fachzeitschriften sieht, stellen eine einzelne Gehirnregion dar, wie den Kortex oder das Hinterhirn oder Mittelhirn. Wir haben ein rudimentäres Ganzhirn-Organoid gezüchtet“, erklärt die Hauptautorin der Arbeit, Annie Kathuria.

Zusammenhängendes Konstrukt

Das vom Forscherteam entwickelte sogenannte Multi-Region Brain Organoid soll die Entwicklung des Gehirns eines menschlichen Fötus nachbilden. Das gelingt laut den Forschern, weil es Organoide des Großhirns, des Mittel- und Hinterhirns sowie Blutgefäßstrukturen (Endothelorganoide) zu einem zusammenhängenden Konstrukt integriert. Damit handle es sich um eine neue Generation von Gehirn-Organoiden und eine erhebliche Verbesserung für die Modellierung der Gehirnentwicklung.

So gingen die Forscher vor: Zunächst züchteten sie Nervenzellen aus einzelnen Hirnregionen und rudimentäre Blutgefäße in separaten Laborschalen. Anschließend klebte das Team die einzelnen Teile mit Proteinen zusammen, die die Bildung von Verbindungen zwischen den Geweben ermöglichen. Als die Gewebe zusammenwuchsen, begannen sie, elektrische Aktivität zu erzeugen und als Netzwerk zu reagieren. Auch hätte das Team die Entstehung einer frühen Blut-Hirn-Schranke beobachten können. Sie dient als Barriere, die das Gehirn schützt, indem sie kontrolliert, welche Moleküle vom Blut ins Gehirn gelangen dürfen.

Neuronale Vielfalt

Laut den Forschern zeigte das entstandene Gehirn-Organoid eine große Vielfalt an neuronalen Zelltypen, deren Eigenschaften denen eines 40 Tage alten menschlichen Fötus ähnelten. Die Größe eines Hirns aus dem Labor beziffern sie auf zwei bis drei Millimeter. Es enthalte sechs bis sieben Millionen Neuronen, also einen Bruchteil der 86 Milliarden Neuronen im Gehirn eines Erwachsenen.

Die Ganzhirn-Organoide sollen helfen, neurologische Erkrankungen besser zu verstehen. „Krankheiten wie Schizophrenie, Autismus und Alzheimer betreffen das gesamte Gehirn, nicht nur einen Teil davon. Wenn wir frühzeitig verstehen, was in der Entwicklung schiefläuft, können wir möglicherweise neue Angriffspunkte für das Wirkstoffscreening finden“, sagt Kathuria. Anhand der Mini-Gehirne wollen die Forscher entstehende Störungen in Echtzeit beobachten und prüfen, ob Behandlungen wirken.

Das Team hat seine Arbeit frei zugänglich in Advanced Science veröffentlicht.

(dgi)

Source link

Künstliche Intelligenz

Wybot C2 Vision Test: Poolroboter mit Kamera-Navigation & KI für unter 700 Euro

Der Poolroboter Wybot C2 Vision wartet mit einer innovativen Kameratechnik auf. Im Test zeigen wir, wie gut er sich in der Praxis schlägt.

Mit dem Wybot C2 Vision bringt Wybotics einen Poolroboter auf den Markt, der durch seine kamerabasierte Navigation auffällt. Ausgestattet mit einem Kamerasystem erkennt der C2 Vision den Pool präzise und passt so seine Reinigungsstrategie intelligent an die Poolform und den erkannten Schmutz an. Wir haben getestet, ob seine Reinigung überzeugt und wie sich der Roboter im Hinblick auf Bedienung und Ausstattung schlägt. Das Testgerät hat uns Geekmaxi zur Verfügung gestellt.

Design & Verarbeitung

Der Wybot C2 Vision kommt im modernen, kompakten Design mit klaren Linien und typischen Materialien. Das Gehäuse wirkt robust und gut verarbeitet, sodass der Roboter auch in anspruchsvollen Poolumgebungen zuverlässig arbeitet. Die Farbgebung in dezentem Anthrazit mit türkisfarbenen Highlights gefällt.

Der Wybot ist mit dem für Poolroboter typischen Kettenantriebssystem ausgestattet, das für gute Traktion auf glatten Oberflächen sorgt. Auffällig ist die Kamera, die auf der Vorderseite relativ zentral platziert ist. Über diese Kamera erkennt der Roboter nicht nur seine Umgebung, sondern auch Verschmutzungen, um sie gezielt anzugehen.

Wybot C2 Vision – Bilder

Im Lieferumfang sind neben dem Roboter und einem Ladekabel ein Rückholhaken sowie ein ultrafeiner Filter enthalten. Letzteren setzt man wahlweise zusätzlich ein, um besonders kleine Partikel aus dem Wasser zu filtern.

Installation: Was richtet man am Wybot C2 Vision ein?

Die Einrichtung des Wybot C2 Vision gestaltet sich einfach. Nach dem Auspacken schließt man den Poolroboter zunächst an die Steckdose an, um ihn vollständig zu laden; kabelloses Laden per Station ist nicht möglich. Während des Ladevorgangs richtet man problemlos die Verbindung zur App ein. Dabei erfolgt die Erkennung in der Wybot-App automatisch und geht schnell von der Hand. Nach dem Laden kann der Wybot auch schon direkt ins Wasser.

Bedienung & Steuerung

Der Wybot C2 Vision lässt sich über die App komfortabel steuern – solange er sich bisher nicht im Wasser befindet. Das ist nicht ungewöhnlich, da Wasser die meisten Verbindungen – etwa via Bluetooth oder WLAN – unterbricht. Andere Hersteller haben dafür schon smarte Lösungen gefunden, die sich jedoch im Preis widerspiegeln.

Neben den Standardmodi für Boden, Wände und Wasserlinie steht ein Komplettmodus zur Verfügung, der alle Bereiche abdeckt. Zudem gibt es für den Boden zwei zusätzliche Modi: Turbo und Eco. Der Turbo-Modus ist sinnvoll, wenn sich im Becken nur wenig Schmutz befindet und man diesen vor dem Badegang noch schnell entfernen möchte.

Besonders spannend ist jedoch der Schmutzerkennungsmodus. Mittels der Kamera kann der Wybot C2 Vision nämlich Schmutz am Boden erkennen und diesen gezielt reinigen. Dabei fährt er den Schmutz so lange an, bis dieser vollständig entfernt ist. In diesem Modus konzentriert sich der Roboter ausschließlich auf erkannte Schmutzstellen, eine vollständige Poolreinigung erfolgt dabei nicht. Für eine Komplettreinigung gibt es andere Modi.

Übrigens kann man auch Zeitpläne in der App erstellen sowie Reinigungsmuster festlegen. Der C2 Vision fährt dann etwa in einer S-Linie oder Kreuzmuster den Pool ab. Auch ein Sternmuster zur Mitte des Pools ist dabei möglich – je nach Vorliebe.

Navigation & Reinigung: Wie smart ist der Wybot C2 Vision?

Die kamerabasierte Navigation macht den Wybot C2 Vision besonders effektiv. Er erkennt die Poolform genau, plant die Reinigungsroute optimal und passt sie dynamisch an Hindernisse und Besonderheiten an. Dabei umfährt er etwa den Bodenablauf oder andere größere Objekte im Becken.

Im Test entfernt der Roboter zuverlässig Algen, Schmutz und Blätter vom Poolboden. Die Bürsten und die Saugleistung überzeugen sowohl auf glatten Flächen als auch an den Wänden. Die Wasserlinie fährt er gründlich ab. Nur in den Ecken und bei den Stufen hat er ein paar Schwierigkeiten bei der Reinigung.

Die Filtereinheit fängt ausreichend Schmutz, bedarf aber einer manuellen Entleerung, was etwas umständlich ist, da sich der Boden nicht öffnen lässt. Immerhin kann der Deckel vollständig abgenommen werden. Positiv ist hingegen, dass der ultrafeine Filter (10 Mikrometer) in Form einer Platte daherkommt, die hinter der Filtereinheit sitzt. Dadurch ist dieser sehr einfach abzuspülen und auszutauschen.

Akku: Wie lange hält der Wybot C2 Vision durch?

Der Wybot C2 Vision verfügt laut Hersteller über einen Akku, der Laufzeiten von bis zu drei Stunden ermöglicht. Das schafft er in unserem Test tatsächlich, und es reicht aus, um auch größere Pools gründlich zu säubern. Sollte der Akku vor Abschluss der Reinigung leer sein, bleibt der Wybot C2 Vision am Boden, wo man ihn mittels des Rückholhakens birgt. Allerdings muss man das ebenso, wenn er den Reinigungsprozess regulär beendet hat. Die Ladezeit beträgt etwa 3 Stunden, was für ein Gerät dieser Klasse üblich ist.

Preis: Wie viel kostet der Wybot C2 Vision?

Bei Geekmaxi gibt es den Wybot C2 Vision mit dem Rabatt-Code 5B1NDUXW für 768 Euro statt 799 Euro. Angesichts der fortschrittlichen Kamera-Navigation, der guten Ausstattung und der flexiblen App-Steuerung bietet der Poolroboter ein hervorragendes Preis-Leistungs-Verhältnis. Das aktuell beste Angebot liegt bei 679 Euro.

Fazit

Der Wybot C2 Vision beeindruckt nicht nur mit seinem vergleichsweise niedrigen Preis. Auch die intelligente, Kamera-gestützte Navigation und die gründliche Reinigungsleistung können sich sehen lassen. Damit besteht er problemlos auch gegen deutlich teurere Modelle. Die Steuerung per App ist umfangreich, wenn auch anfangs etwas komplex, bietet jedoch viele Anpassungsmöglichkeiten. Die solide Verarbeitung und der faire Preis runden das positive Bild ab.

Source link

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

Datenschutz & Sicherheitvor 2 Monaten

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings

Online Marketing & SEOvor 2 Monaten

TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

Apps & Mobile Entwicklungvor 2 Monaten

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

10.000 Euro Tickets? Kann man machen – aber nur mit diesem Trick

Digital Business & Startupsvor 1 Monat

10.000 Euro Tickets? Kann man machen – aber nur mit diesem Trick

UX/UI & Webdesignvor 2 Monaten

Philip Bürli › PAGE online

80 % günstiger dank KI – Startup vereinfacht Klinikstudien: Pitchdeck hier

Digital Business & Startupsvor 1 Monat

80 % günstiger dank KI – Startup vereinfacht Klinikstudien: Pitchdeck hier

Patentstreit: Western Digital muss 1 US-Dollar Schadenersatz zahlen

Apps & Mobile Entwicklungvor 1 Monat

Patentstreit: Western Digital muss 1 US-Dollar Schadenersatz zahlen

LinkedIn Feature-Update 2025: Aktuelle Neuigkeiten

Social Mediavor 2 Monaten

LinkedIn Feature-Update 2025: Aktuelle Neuigkeiten

Inspohub

Studie: Große KI-Modelle greifen unter „Stress“ auf Erpressung zurück

Künstliche Intelligenz

Studie: Große KI-Modelle greifen unter „Stress“ auf Erpressung zurück

So reagieren autonome KI-Agenten

„Strategisches Denken“

Weitere Studien und Beobachtungen

Künstliche Intelligenz

macOS 26 mit Liquid Glass: Icon-Änderung facht Diskussionen an

Apple musste neues Finder-Icon entschärfen

Viele Diskussionen um Apples Liquid Glass

Künstliche Intelligenz

Forscher züchten „Ganzhirn“ im Mini-Format zur Erforschung von Krankheiten

Zusammenhängendes Konstrukt

Neuronale Vielfalt

Künstliche Intelligenz

Wybot C2 Vision Test: Poolroboter mit Kamera-Navigation & KI für unter 700 Euro

Design & Verarbeitung

Installation: Was richtet man am Wybot C2 Vision ein?

Bedienung & Steuerung

Navigation & Reinigung: Wie smart ist der Wybot C2 Vision?

Akku: Wie lange hält der Wybot C2 Vision durch?

Preis: Wie viel kostet der Wybot C2 Vision?

Fazit

macOS 26 mit Liquid Glass: Icon-Änderung facht Diskussionen an

Dell-Notebooks: Kritische Lücken machen Sicherheitskomponente zum Risiko

Every unicorn has a beginning. Start yours at STARTUPLAND

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

Beliebt

Inspohub

Studie: Große KI-Modelle greifen unter „Stress“ auf Erpressung zurück

So reagieren autonome KI-Agenten

„Strategisches Denken“

Weitere Studien und Beobachtungen

Das könnte Ihnen gefallen

Künstliche Intelligenz

macOS 26 mit Liquid Glass: Icon-Änderung facht Diskussionen an

Apple musste neues Finder-Icon entschärfen

Viele Diskussionen um Apples Liquid Glass

Künstliche Intelligenz

Forscher züchten „Ganzhirn“ im Mini-Format zur Erforschung von Krankheiten

Zusammenhängendes Konstrukt

Neuronale Vielfalt

Künstliche Intelligenz

Wybot C2 Vision Test: Poolroboter mit Kamera-Navigation & KI für unter 700 Euro

Design & Verarbeitung

Installation: Was richtet man am Wybot C2 Vision ein?

Bedienung & Steuerung

Navigation & Reinigung: Wie smart ist der Wybot C2 Vision?

Akku: Wie lange hält der Wybot C2 Vision durch?

Preis: Wie viel kostet der Wybot C2 Vision?

Fazit

macOS 26 mit Liquid Glass: Icon-Änderung facht Diskussionen an

Dell-Notebooks: Kritische Lücken machen Sicherheitskomponente zum Risiko

Every unicorn has a beginning. Start yours at STARTUPLAND

Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken

TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings

Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen

Beliebt