Apps & Mobile Entwicklung
Claude Code und Co.: Wie sich autonome KI-Agenten im Web angreifen lassen
Je mehr sich KI-Agenten verbreiten, die autonom durch das Web steuern, desto relevanter werden die Sicherheitsrisiken, die von entsprechenden Systemen ausgehen. DeepMind-Forscher geben in einer Studie (via Decoder) nun einen systematischen Überblick über Angriffsmuster, die sie als Agenten-Fallen beschreiben.
Was sich mit den autonomen Agenten verändert, sind grundlegende Charakteristika des Webs, heißt es in dem Paper. Bislang war das Web für menschliche Augen gebaut, nun erfolgt der Wandel zum maschinellen Lesen.
Es gibt verschiedene Möglichkeiten, die KI-Agenten zu attackieren. Angreifer können etwa Inhalte ins Web stellen, die manipulierte Prompts enthalten. Möglich ist aber auch, die Wissensbasis oder die Reasoning-Fähigkeiten der Modelle zu attackieren, sodass der Output kompromittiert wird, ohne dass ein schadhafter Prompt-Befehl nötig wäre. Und die Menschen, die Agenten bedienen, können ebenso das Ziel von Angreifern sein.
Insgesamt sind es sechs Angriffstypen für Agenten-Fallen („AI Agent Traps“) im Web, die die DeepMind-Forscher in ihrem Framework beschreiben:
- Content Injection Traps
Ziel: Wahrnehmung
Angriffsart: Eingebettete Befehle in Bereichen wie CSS, HTML, Metadaten oder Syntax-Masken, die für Menschen unsichtbar, aber für den Agenten auswertbar sind. - Semantic Manipulation Traps
Ziel: Reasoning
Angriffsart: Input-Daten so manipulieren, dass das Schlussfolgern eines Agenten verzerrt wird, ohne dass entsprechende Prompt-Eingaben nötig sind. - Cognitive State Traps
Ziel: Speicher und Lernen
Angriffsart: Schadhafte Informationen in das interne Gedächtnis, die Wissensbasis und die gelernten Verhaltensweisen eines Agenten einschleusen, sodass diese dauerhaft korrumpiert sind. - Behavioural Control Traps
Ziel: Aktionen
Angriffsart: Explizite Anweisungen, die die Handlungsfähigkeiten eines Agenten ausnutzen, um Ziele des Angreifers zu verfolgen. - Systemic Traps
Ziel: Multi-Agent-Systeme
Angriffsart: Eine Umgebung so manipulieren, dass über korrelierendes Verhalten großskalige Fehlfunktionen von mehreren Agenten ausgelöst werden. - Human in the Loop
Ziel: Menschlicher Aufseher
Angriffsart: Agenten so manipulieren, dass kognitive Fehleinschätzungen menschlicher Aufseher ausgenutzt werden.
In der Praxis überschneiden sich die einzelnen Agenten-Fallen oder Angreifer nutzen mehrere Mechanismen, um ihre Ziele zu erreichen. Noch sind nicht alle Bereiche gleichermaßen erforscht oder relevant. Während Content Injections oder Beavioural Control Taps besser verstanden sind (und häufiger auftreten), sind Angriffsfelder wie Human-in-the-Loop bislang eher eine theoretische Angriffsfläche, die die Forscher antizipieren.
Welche Probleme in der Praxis auftreten, hat der IT-Sicherheitsforscher Johann Rehberger auf dem Hacker-Kongress 39C3 im Dezember 2025 beschrieben. Bei den Sicherheitslücken handelte es sich um Content Injections, also manipulierte Prompt-Eingaben. Anbieter schließen zwar solche Schwachstellen, schon heute ist es aber ein Katz-und-Maus-Spiel zwischen Angreifern und Entwicklern.
Die möglichen Motive für den Einsatz von Agent-Traps sind vielfältig. Kommerzielle Akteure könnten versuchen, heimlich für Produkte zu werben, kriminelle Akteure könnten private Nutzerdaten abgreifen, und staatliche Stellen könnten darauf abzielen, Falschinformationen in großem Umfang zu verbreiten.
Studie AI A“gent Traps“
Solche Vorkehrungen sind bedeutsam, denn die Schäden können weitreichend sein. Denkbar ist etwa, dass manipulierte Agenten sensible Daten preisgeben oder finanzielle Überweisungen vornehmen, ohne dass Nutzer etwas merken. Laut den Forschern könnten Unternehmen die Agenten für heimliche Produktwerbung korrumpieren und staatliche Akteure könnten diese für Fake News einsetzen.
Agenten-Entwickler arbeiten an neuen Sicherheitskonzepten
Anbieter arbeiten an Sicherheitsvorkehrungen. Anthropic beschreibt in der Dokumentation, wie man etwa mit Sandboxing-Maßnahmen und Rechtemanagement verhindern will, dass Claude Code etwa manipulierte Befehle ausführt. Google hatte bereits im November 2025 ein Konzept für das Absichern von Agenten-Browsern vorgestellt. Bei diesem ist ein zweites KI-Modell tätig, das ausschließlich kontrollieren soll, ob das zentrale Modell die eigentlichen Aufgaben erfüllt.
Erst in dieser Woche hat Foxit ein Sicherheitssystem für PDF-Reader präsentiert, das das Auslesen manipulierten Codes unterbinden soll. Ein PDF-Aktionsinspektor prüft Dokumente proaktiv auf eingebettetes JavaScript und selbstmodifizierendes Verhalten. Dabei handelt es sich um Bedrohungen, die Schwärzungen umgehen, sensible Daten offenlegen oder die Dokumentausgabe unbemerkt verändern können.
Schon das Modelltraining ist für Absicherung entscheidend
Die DeepMind-Forscher beschreiben in dem Paper ebenfalls, dass es schon beim Modelltraining nötig ist, auf die Robustheit zu achten. Die KI-Systeme müssen in der Lage sein, manipulierte Anweisungen zu erkennen, schadhafte Inhalte zu filtern und den Output zu prüfen. Weil sich viele Angriffsmuster nicht standardisiert testen lassen, gewinnen automatisierte Red-Teaming-Methoden an Bedeutung.
Ebenso angepasst werden müsste laut den DeepMind-Forschern das Ökosystem im Web. Möglich ist das etwa durch Trusted-Content, also für KI-Agenten freigegebene Inhalte, die sich standardmäßig als vertrauenswürdige Quelle verifizieren lassen.
Apps & Mobile Entwicklung
Howto: ComputerBase Community-Benchmarks 2.0 – ComputerBase
Wir haben unsere Community-Benchmarks neu aufgelegt. Version 2.0 kann viel mehr: z.B. den Durchschnitt der Leistung einer GPU oder einer CPU ermitteln und darstellen. Auch werden Community-Einsendungen automatisch übernommen und Benchmark-Historien je Teilnehmer erstellt. Alle Details im Überblick.
Der Überblick im Video
Einen kompakten Überblick über die neuen ComputerBase-Community-Benchmarks 2.0, die im Community-Benchmark zu Forza Horizon 6 ihre Premiere feiern, liefert Jan im folgenden Video:
Alle Informationen im Detail
Alle Details zum Nachschlagen gibt es nachfolgend aber auch noch einmal in schriftlicher Form. Im Anschluss dürften alle Fragen zur Teilnahme über das Teilnahmeformular, das für bei ComputerBase registrierte Accounts möglich ist, geklärt sein.
Los geht es mit dem ersten Abschnitt des Teilnahmeformulars, der das eigene System betrifft.
1. Dein System
Betriebssystem
Eure erste Wahl betrifft das Betriebssystem. Drei verschiedene Plattformen stehen zur Wahl:
Doch Windows ist nicht gleich Windows, Linux nicht gleich Linux und macOS nicht zwangsläufig gleich macOS – daher gibt es innerhalb einer Plattform noch eine Wahlmöglichkeit, wobei das ältere Windows 10 lediglich pauschal, Windows 11 wiederum mit mehreren letzten Hauptversionen zur Verfügung steht. Bei Linux wird nicht nach Distribution, sondern nach Kernel unterschieden. Bei macOS sind es Hauptversionen. (Eine Plattform, die du für einen Benchmark nutzt, ist nicht enthalten? Gib uns Bescheid!)
Dass damit insbesondere nicht alle wesentlichen Unterschiede verschiedener Linux-Systeme (Proton etc.) erschlagen wurden, ist uns bewusst. Aber es gilt die Balance zwischen Detailgrad und Handhabbarkeit der Community-Benchmarks zu wahren. Weitere Informationen können unter „3. Ergänzende Hinweise (optional)“ aber jederzeit mit abgegeben werden und sind auch von anderen Nutzern sicherlich gerne gesehen!
Prozessor
Den von euch genutzten Prozessor wählt ihr im Dropdown aus. (Eine CPU, die du für einen Benchmark nutzt, ist nicht enthalten? Gib uns Bescheid!)
Darüber hinaus könnt ihr optional angeben, ob ihr „Overclocking“ oder „Undervolting“ betrieben oder in die Standard-TDP eingegriffen habt. Konkret definieren wir die drei Punkte wie folgt:
- Overclocking: Der Takt wurde gegenüber dem Standardtakt angehoben
- Undervolting: Die Spannung wurde gegenüber der Standardspannung gesenkt
- cTDP (Config TDP): Die TDP (Verlustleistung) wurde angepasst (zum Beispiel Ryzen „ECO Mode“)
Gerne könnt ihr im Feld „Bemerkungen“ genauere Angaben zu euren Eingriffen machen und diese im vom Benchmark-Formular nach dem Absenden erstellten Forenbeitrag auch mit Screenshots belegen.
Welcher Prozessor im System steckt, kann über Tools wie CPU-Z, HWiNFO, aber auch ganz einfach den Windows Task-Manager ermittelt werden (STRG + ALT + ENTF – Task-Manager).
Nach Auswahl des Reiters „Leistung“ wird die CPU in der Ansicht „CPU“ beim Namen genannt. Alternativ melden Tools wie CPU-Z die CPU auf dem 1. Reiter:
Grafikkarte
Auch die von euch genutzte Grafikkarte wählt ihr im Dropdown aus. (Eine GPU, die du für einen Benchmark nutzt, ist nicht enthalten? Gib uns Bescheid!)
Dabei gilt es darauf zu achten, dass in Systemen, deren CPU eine iGPU besitzt, aber in denen auch eine separate Grafikkarte Verwendung findet, immer nur die im Benchmark genutzte Grafikeinheit angegeben wird.
Darüber hinaus könnt ihr auch hier optional angeben, ob ihr „Overclocking“ oder „Undervolting“ betrieben oder in die Standard-TDP eingegriffen habt. Konkret definieren wir die drei Punkte wie folgt:
- Overclocking: Der Takt wurde gegenüber dem Standardtakt angehoben
- Undervolting: Die Spannung wurde gegenüber der Standardspannung gesenkt
- cTDP (Config TDP): Die TDP (Verlustleistung) wurde angepasst (Power-Target angepasst)
Gerne könnt ihr im Feld „Bemerkungen“ genauere Angaben zu euren Eingriffen machen und diese im vom Benchmark-Formular nach dem Absenden erstellten Forenbeitrag auch mit Screenshots belegen.
Welche Grafikeinheiten im Rechner stecken, darüber informiert beispielsweise GPU-Z, aber erneut kann unter Windows auch der Task-Manager (STRG + ALT + ENTF – Task-Manager) Auskunft geben. Nach Auswahl des Reiters „Leistung“ werden die aktiven GPUs direkt in der linken Seitenleiste genannt:
- Nvidia GeForce RTX 4070 Ti Super (dGPU)
- AMD Radeon Graphics (iGPU im Ryzen 7 7700)
Praktisch an GPU-Z ist, dass auch direkt der Grafiktreiber beim öffentlichen Namen genannt wird, während der Taskmanager nur die weniger bekannte „intern“ Versionsnummer ausgibt:
Grafiktreiber
Stichwort Grafiktreiber: Je nach Auswahl bei Betriebssystem und Grafikkarte ist in diesem Dropdown bereits eine Vorauswahl getroffen. Unter Windows stehen für AMD, Intel und Nvidia zahlreiche auch ältere Treiber zur Wahl. Die Treiber-Version kann über die Control Panels der Hersteller (Arc Control Panel, AMD Software: Adrenalin Edition, Nvidia App) oder Tools wie GPU-Z in Erfahrung gebracht werden.
Unter Linux kann auch die Mesa-Version angegeben werden. Unter macOS und bei Verwendung eines Qualcomm-Snapdragon-Notebooks gibt es vorerst hingegen nur die generische Auswahl „macOS-Grafiktreiber“ oder „Qualcomm-Grafiktreiber“.
Warum der Treiber überhaupt ausgewählt werden muss? Die neuen Community-Benchmarks sollen keine Eintagsfliege bleiben, sondern durch die Mitarbeit der ganzen Community dauerhaft Ergebnisse liefern – und was könnte da spannender sein als die Entwicklung der Leistung mit neuen Grafiktreibern auf Basis einer breiten Masse an Messwerten?
Arbeitsspeicher
RAM-Kapazität und -Takt werden ebenfalls per Dropdown gewählt. (Deine Kapazität oder dein Takt fehlt? Gib uns Bescheid!).
Sollte der von euch genutzte RAM-Takt zwischen im Dropdown bereits verfügbaren Taktraten liegen, wählt bitte den nächstgelegenen Takt aus.
Wie viel RAM mit welchem Takt im Rechner steckt, meldet der Windows Task-Manager ebenfalls.
Was dort fehlt, ist eventuell der Speicher-Standard. Er kann beispielsweise über CPU-Z im Reiter „Memory“ ermittelt werden (hier DDR5):
Hast du alle erforderlichen Angaben zu deinem System gemacht, kann es an das Einreichen von Testergebnissen gehen.
2. Deine Ergebnisse
Wichtig: Auch in Zukunft werden Community-Benchmarks nicht nur klassische Standard-Benchmarks, sondern auch komplexere Testszenarien wie Gaming-Benchmarks enthalten, bei denen zur korrekten Durchführung die gemachten Vorgaben (im Wesentlichen Grafikeinstellungen) penibel befolgt werden müssen. Nur dann, wenn auch wirklich das getestet wurde, was gefragt war, können am Ende aussagekräftige und vergleichbare Ergebnisse dabei herauskommen.
Sind die Ergebnisse ermittelt, können sie unter „2. Deine Ergebnisse“ eingetragen werden. Es müssen dabei nicht alle Ergebnisse geliefert werden, es können Formularfelder frei bleiben. Auch können nach dem Absenden eines Ergebnisses noch weitere Ergebnisse der gleichen Art gemeldet werden. Einmal übermittelte Ergebnisse können aber nicht mehr verändert werden. Du hast ein falsches Ergebnis übermittelt?! Dann kannst du uns auch dazu im Thread zu diesem Inhalt einen Hinweis geben!
3. Ergänzende Hinweise
Vor dem Absenden lassen sich im Kasten „3. Ergänzende Hinweise (optional)“ abschließend weitere Details zum eigenen System abgeben: Was bedeutet „OC“ bei der CPU genau? Welche TDP lag im Desktop oder Notebook an? Oder welche Proton-Version kam unter Linux zum Einsatz? Alles, was später hilft, das eigene Ergebnis im Vergleich zu anderen (mit der gleichen Hardware) einzuordnen, ist von Nutzen.
Das passiert nach dem Absenden
Nach dem Absenden über „Ergebnisse einreichen“ werden die von euch eingereichten Ergebnisse bei uns in der Datenbank gespeichert und parallel als editierbarer Forenbeitrag abgelegt. Zudem erfolgt die Ausgabe der Werte in von uns zuvor konfigurierten Diagrammen. Die Ausgabe von Einzelwerten, aber auch die Ausgabe von Durchschnitten aus Ergebnissen mit der gleichen Grafikkarte oder der gleichen CPU sind möglich. Theoretisch ließe sich auch die Leistung nach Grafikkarten und zugleich Treiberversionen ausgeben – und so weiter und so fort.
Die von euch über ein Benchmark-Formular bereits eingereichten Ergebnisse und die dabei genutzte Systemkonfiguration werden darüber hinaus dauerhaft am Kopf des Formulars gespeichert. Formularübergreifend finden sich alle bis dato eingereichten Benchmark-Ergebnisse zudem in einem neuen Reiter in den Benutzerinformationen in der Community.
Fehlt etwas?
Die Drop-Down-Menüs für Prozessoren, Grafikkarten, Treiber, RAM-Kapazitäten und -Geschwindigkeiten enthalten die meisten der über die letzten Jahre verfügbaren/gängigen Konfigurationen. Du hast eine ältere CPU, eine ältere Grafikkarte oder vielleicht ein ganz exotisches Modell? Oder der von dir genutzte Treiber ist nicht oder noch nicht enthalten? Kein Problem!
Gib uns im Kommentar-Thread zu diesem Inhalt Bescheid und wir kümmern uns schnellstmöglich darum, dass auch du deine Konfiguration korrekt eintragen und ein Benchmark-Ergebnis übermitteln kannst.
Macht mit!
Mit den Community-Benchmarks 2.0 heben wir das vor Jahren von ComputerBase ins Leben gerufene Community-Benchmark-Format auf ein neues Level: Eure Messergebnisse sind ab sofort nicht mehr nur Teil eines langen, auf einen Artikel bezogenen Diagramms, das schnell unübersichtlich wird, sondern können automatisiert ausgewertet oder in anderen Inhalten weiterverfolgt werden – und von anderen Nutzern auf eurer Profilseite in der Community eingesehen werden.
Ihr habt schon an dem ein oder anderen Community-Benchmark teilgenommen, aber jetzt aufgerüstet, oder einen neuen Treiber installiert? Nehmt erneut teil und mit der Zeit wird die Datenbasis immer mehr Erkenntnisse zu Tage fördern.
Wir können viel benchen, aber mit euch können wir noch viel mehr! Forza Horizon 6 ist erst der Anfang. Macht mit!
Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.
Apps & Mobile Entwicklung
Abo-Preiserhöhung: Sony erhöht die Kosten für PlayStation Plus

Sony erhöht die Preise für das PlayStation-Plus-Abo. Der Schritt folgt auf eine Preiserhöhung der Konsolen. Das liegt im Trend in einer Branche, die aktuell höhere Summen verlangt. Alle Karten legt das Unternehmen jedoch noch nicht auf den Tisch.
„Aufgrund der aktuellen Marktlage“ werden ab dem 20. Mai in ausgewählten Regionen für Neukunden höhere Preise für PlayStation Plus verlangt, schreibt Sony knapp. Sie beginnen dann bei rund 10 statt 9 Euro für ein Einmonatsabo, eine Laufzeit von drei Monaten verteuert sich um drei Euro und kostet künftig knapp 28 Euro. Das entspricht einer Preissteigerung von etwas mehr als zehn Prozent, die allerdings nur für neue Abos und nicht für Bestandskunden gilt.
Ob die darüber liegenden Abos „Extra“ und „Premium“ oberhalb der Basis-Stufe „Essential“, die vor allem die Nutzung von Multiplayer-Modi erlaubt, auch von der Preiserhöhung betroffen sind, geht aus der knappen Ankündigung auf X nicht hervor.
Die Stufen würden bei einem Monat Laufzeit bei etwa 14,50 und 18 Euro liegen, eine ähnliche Anhebung vorausgesetzt. Die muss allerdings nicht gegeben sein, wenn Sony das Verhältnis von Essential- zu Extra- und Premium-Kunden nicht gefällt, sondern kann auch genutzt werden, um die teureren Varianten durch geringere Mehrpreise attraktiver zu machen.
Was heißt Marktlage?
Was genau Sony unter der Marktlage versteht, lässt sich nur abschätzen. Zum einen sind da die durch den KI-Goldrausch massiv gestiegenen Hardwarepreise, die auch und insbesondere das Server-Segment betreffen.
Zum anderen operiert Sony in einem Umfeld, in dem Wettbewerber Preise längst angezogen haben. Das gilt nicht nur für Konsolen, wo das gesamte Trio aus PlayStation, Xbox und Switch teurer geworden ist, sondern auch für die Online-Dienste. Microsoft hatte die Kosten des Game Pass erst deutlich erhöht und dann wieder ein wenig gesenkt. Nintendo hat die Preise für „Online“ im Rahmen der letzten Konsolen-Preiserhöhung angezogen – allerdings aktuell nur in Japan.
In diesem Rahmen kann Sony als letzter Anbieter mit „alten“ Preisen relativ bequem nachziehen und auf gestiegene Sockelkosten reagieren oder einfach die Gewinnspanne optimieren.
Apps & Mobile Entwicklung
Zero Parades: For Dead Spies: Nachfolger von Disco Elysium hat viel zu bieten

Der Nachfolger des hochgelobten Rollenspiels Disco Elysium ist da. Das erneut textlastige Spionage-RPG, das unter anderem Psyche und Gedanken der Hauptfigur sprechen lässt, reicht nicht ganz an den Kult-Vorgänger heran, hat aber eine Menge zu bieten.
„Erzählstark“ nennen die Entwickler ihr Werk, in dem dieses Mal statt des abgehalfterten Ermittlers mit Gedächtnislücken eine Spionin im Mittelpunkt steht, die vergangenes Scheitern ausradieren und sich erneut beweisen möchte. Neues Scheitern müssen Spieler dank komplexer Mechaniken in Kauf nehmen, denn wie in einem Tabletop-Spiel wird Erfolg gewürfelt. Scheitern heiße jedoch nur, umzudenken. Wie in Disco Elysium stehen sie dabei in Kontakt mit dem „Inneren Selbst“ der Hauptfigur, deren Gedanken (unzuverlässige) Hinweise geben. Die Entwicklung dieses inneren Denkens sollen Spieler nun gezielter beeinflussen können.
Begegnungen, nicht notwendigerweise im Kampf, bleiben eine Säule des Spielkonzepts. Die nur in englischer Sprache vertonten Dialoge sind umfangreich. Es gibt aber auch taktische Begegnungen und Gelegenheiten, Werkzeuge einzusetzen, um unter anderem zu manipulieren und zu täuschen. Versprochen wird ein absurder Cast, man treffe „auf internationale Banker, Technofaschisten aus dem Ausland, übersinnliche Doppelgänger, einen paranoiden Fernsehstar, einen Mann mit einer Kiste als Herz“ und weitere skurrile Figuren, verspricht die Produktseite. Dabei gilt es, die Fragilität der eigenen Psyche im Blick zu behalten.
Gut, sagen Tests
Erscheinen wird Zero Parades am 21. Mai 2026 auf dem PC über Steam, Epic und GOG, Konsolen sollen im Laufe des Jahres folgen. Auf Metacritic erreicht das Spiel aktuell 83 Punkte, 6 weniger als der Vorgänger. Die Wertungen sind gespaltener.
Für Eurogamer funktioniert das Spiel hervorragend. Erzählung, die Meta-Ebene, eine Betrachtung von Authentizität, Kapitalismus und Konsum, Reaktionen auf den Spieler, das ergibt für die Seite einen tollen Mix. Dual Shockers lobt ebenfalls, schränkt aber ein, dass man sich auf die Spielweise einlassen und vor allem aufmerksam spielen müsse. Je weiter die Wertung sinkt, desto eher wirkt Zero Parades aber wie eine „blasse Imitation“ des Vorgängers (Game Spot), wenngleich es weiterhin ein „gutes Rollenspiel“ bleibe.
-
Künstliche Intelligenzvor 3 Monaten
Top 10: Die beste kabellose Überwachungskamera im Test – Akku, WLAN, LTE & Solar
-
Social Mediavor 3 MonatenCommunity Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast
-
Entwicklung & Codevor 2 MonatenCommunity-Protest erfolgreich: Galera bleibt Open Source in MariaDB
-
Künstliche Intelligenzvor 2 MonatenBlade‑Battery 2.0 und Flash-Charger: BYD beschleunigt Laden weiter
-
Künstliche Intelligenzvor 2 Monaten
Top 10: Der beste Luftgütesensor im Test – CO₂, Schadstoffe & Schimmel im Blick
-
Apps & Mobile Entwicklungvor 2 MonatenMähroboter ohne Begrenzungsdraht für Gärten mit bis zu 300 m²
-
Künstliche Intelligenzvor 2 MonateniPhone Fold Leak: Apple spart sich wohl iPad‑Multitasking
-
Social Mediavor 2 MonatenVon Kennzeichnung bis Plattformpflichten: Was die EU-Regeln für Influencer Marketing bedeuten – Katy Link im AllSocial Interview

