Apps & Mobile Entwicklung

Autonom Exploits entwickeln: Anthropics neues Modell ist so stark, dass es nicht veröffentlicht wird

Claude Mythos ist Anthropics neues Spitzenmodell. Weil die internen Tests zeigten, dass es zu leistungsfähig beim Entdecken und Ausnutzen von Sicherheitslücken ist, stellt es Anthropic aktuell nur als Vorschau für einen ausgewählten Kreis von Organisationen bereit. Diese sollen die Möglichkeit haben, Systeme abzusichern.

Dieses Sicherheitsprojekt läuft unter dem Titel Glasswing. Beteiligt sind Unternehmen und Dienste wie Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, die Linux Foundation, Microsoft, Nvidia und Palo Alto Networks. Zugang zu Claude Mythos haben zudem 40 weitere Gruppen, die kritische Infrastruktur betreiben.

Abgesichert werden sollen auf diese Weise auch Open-Source-Systeme. Organisationen, die sich um Open-Source-Sicherheit kümmern, erhalten von Anthropic direkt 4 Millionen US-Dollar. Insgesamt werden den Partnern beim Project Glasswing Computing-Kapazitäten zur Verfügung gestellt, die bis zu 100 Millionen US-Dollar wert sind.

Neu: Claude Mythos findet Sicherheitslücken und entwickelt direkt Exploits

Die Fortschritte, die Anthropic bei Claude Mythos beschreibt, sind bemerkenswert. Grundsätzlich handelt es sich um ein normales KI-Modell, das auf das bisherige Spitzenmodell Opus 4.6 folgt. Im Bereich der IT-Sicherheit wurde laut Anthropic aber eine Schwelle überschritten. „Mythos Vorschau hat bereits Tausende von Sicherheitslücken mit hohem Schweregrad entdeckt, darunter auch einige in allen gängigen Betriebssystemen und Webbrowser“, heißt es in der Mitteilung.

Dazu zählt etwa eine 27 Jahre alte Sicherheitslücke im Betriebssystem OpenBSD, das als besonders sicher gilt. Angreifer sollen durch die Schwachstelle aber die Möglichkeit gehabt haben, OpenBSD-Systeme allein durch einen Remote-Zugriff zum Absturz zu bringen. Bei FFmpeg entdeckte das KI-Modell eine 16 Jahre alte Sicherheitslücke in einem Code-Bereich, den automatisierte Test-Tools bereits fünf Millionen Mal geprüft haben. Und beim Linux-Kernel entdeckte Claude Mythos mehrere Schwachstellen und verknüpfte sie autonom zu einem Exploit, der es Angreifern ermöglicht, von gewöhnlichen Zugriffsrechten zur vollen Kontrolle eines Systems zu springen.

Details zu den autonom entdeckten Sicherheitslücken und Exploits beschreibt Anthropics Red Team in einem Blog-Beitrag.

Firefox zeigt, wie schnell sich die Modelle verbessern

Vor allem das autonome Entwickeln der Exploits unterscheidet Mythos von den Vorgängern. Ein Beispiel ist das Sicherheitsprojekt bei Firefox. Anthropic hatte im Winter mit Mozilla kooperiert, um mit Opus 4.6 autonom Schwachstellen im Browser zu entdecken. Das bisherige Spitzenmodell war aber praktisch noch nicht in der Lage, diese Sicherheitslücken in Exploits zu übersetzen. Das ändert sich nun.

Sicherheitsanalyse mit KI: Anthropics Opus 4.6 findet 22 Sicherheitslücken in Firefox

Bei den in der JavaScript-Enginge von Firefox 147 entdeckten Sicherheitslücken brauchte Opus 4.6 noch mehrere Hundert Anläufe, um zwei Exploits zu entwickeln. Mit Firefox 148 wurden all diese Schwachstellen bereits behoben. Anthropic nutzte aber die Erkenntnisse als Benchmark für die Vorschau-Version von Mythos. Das Resultat: Es wurden 181 funktionierende Exploits entwickelt und in 29 weiteren Fällen die Registerkontrolle erreicht.

Claude Mythos nicht für die Allgemeinheit

Aktuell plant Anthropic nicht, die Vorschau von Claude Mythos allgemein bereitzustellen. Details zum Modell werden aber in der Systemcard beschrieben. Das langfristige Ziel ist laut Anthropic allerdings, Nutzern die Modelle mit einer solchen Leistungsstärke neben dem Bereich Cybersicherheit auch für weitere Anwendungsbereiche bereitzustellen.

Generell gehe es jetzt zunächst um das Entwickeln neuer Sicherheitsvorkehrungen. Die Ergebnisse will man in die kommenden Claude-Opus-Modelle integrieren.

Entwickler registrieren Wandel bei den AI-Sicherheitshinweisen

Entwickler und IT-Sicherheitsexperten bemerken schon länger einen Wandel. Zu erklären, dass „das neue Modell zu gefährlich ist“, bezeichnet etwa der Entwickler Simon Willison als einen Weg, um das Interesse zu wecken, hält die Vorsicht in diesem Fall aber für gerechtfertigt. Er verweist auf populäre Entwickler wie Greg Kroah-Hartman vom Linux-Kernel und Daniel Sternberg von cURL, die beide schon in den letzten Tagen erklärten, dass die Welle an AI-Slop-Reports sich in kurzer Zeit zu etwas gewandelt haben, was echten Sicherheitshinweisen entspricht.

Dass die Modelle leistungsfähiger werden, ist auch in weiteren Bereichen sichtbar. ComputerBase hat die Erfahrungen mit Anthropics KI-Agenten Claude Code in einem Langzeittest analysiert.

Source link

Verwandte Themen:Anthropics Autonom dass entwickeln exploits ist Modell neues nicht stark veröffentlicht wird

Up Next

Insta360 Snap: Selfie-Bildschirm für die Kameras der Smartphone-Rückseite

Nicht verpassen

Gratis-Extra im Wert von 158 Euro abstauben

Apps & Mobile Entwicklung

Sicherheitsscanner: Perplexity veröffentlicht Bumblebee als freie Software

Der KI-Anbieter Perplexity hat mit Bumblebee einen Sicherheitsscanner für Entwickler veröffentlicht, der helfen soll, risikobehaftete Pakete und Erweiterungen aufzuspüren. Weshalb das Unternehmen die Open-Source-Lösung nach der gemeinhin als besonders friedfertig geltenden Hummel benannt hat, bleibt bislang allerdings offen.

Aktuell nicht für Windows erhältlich

Mit Bumblebee will Perplexity Entwicklern ein internes Werkzeug an die Hand geben, um den zunehmenden Bedrohungen durch Angriffe auf die Software-Lieferkette besser begegnen zu können. Bislang wurde das Tool ausschließlich für macOS und Linux entwickelt, ob künftig auch eine Windows-Version geplant ist, bleibt derzeit offen. In lokalen Entwicklerumgebungen soll Bumblebee risikobehaftete Pakete, Browser- und Editor-Erweiterungen sowie Konfigurationen von KI-Werkzeugen aufspüren können, ohne dabei Änderungen am jeweiligen System vorzunehmen.

Fokussierte Problemlösung

Dabei hält Perplexity den Aufgabenbereich von Bumblebee bewusst eng gefasst und konzentriert sich gezielt auf ein einzelnes Problem, statt daraus eine umfangreiche Sicherheits-Suite mit zahlreichen Funktionen zu machen. Entsteht durch kompromittierte Pakete, Erweiterungen oder Entwicklerwerkzeuge ein Sicherheitsrisiko, soll das Tool Teams dabei unterstützen, schnell nachvollziehen zu können, welche und zugleich wie viele Rechner betroffen sein könnten. Statt wie häufig üblich ausschließlich ausgelieferte Software über SBOMs oder das Laufzeitverhalten mittels EDR-Lösungen zu analysieren, greift Bumblebee auf lokale Metadaten aus Lockfiles, Paketmanager-Einträgen, Erweiterungsmanifesten sowie unterstützten MCP-Konfigurationsdateien zurück und wertet diese aus. Anschließend erzeugt das Werkzeug strukturierte NDJSON-Datensätze, die sich sowohl manuell prüfen als auch mit anderen Expositionskatalogen abgleichen lassen.

Nur gucken, nicht anfassen!

Laut einem Blog-Eintrag von Perplexity arbeitet der Scanner dabei ausschließlich schreibgeschützt. Weder Paketmanager wie npm, pip oder Go noch andere Befehle werden aktiv ausgeführt, zudem liest Bumblebee keine Quelldateien aus. Gerade npm-Pakete können sogenannte Postinstall-Skripte enthalten, die automatisch gestartet werden, sobald npm install diese verarbeitet. Nach Angaben von Perplexity sollen sich auf diesem Weg zahlreiche der jüngsten Lieferketten-Würmer verbreitet haben. Ein Scanner, der npm zur Überprüfung einer möglichen Exponierung direkt aufruft, würde den eigentlichen Angriff damit bereits selbst auslösen. Genau solche Risiken sollen mit Bumblebee vermieden werden.

Damit macht Perplexity zugleich deutlich, dass Bumblebee nicht dafür entwickelt wurde, Sicherheitslücken im eigentlichen Quellcode aufzuspüren. Stattdessen steht die schnelle Erkennung von Beständen und potenziellen Schwachstellen auf Entwickler-Endpunkten im Mittelpunkt.

Bereits jetzt unterstützt Bumblebee eine Vielzahl unterschiedlicher Entwicklungsumgebungen:

Paketmanager für Programmiersprachen: npm, pnpm, Yarn, Bun, PyPI, Go modules, RubyGems, Composer
KI-Agenten-Konfigurationen: MCP
Editor-Erweiterungen: VS Code-Familie (VS Code, Cursor, Windsurf, VSCodium)
Browser-Erweiterungen: Chromium-Familie (Chrome, Comet, Edge, Brave, Arc) und Firefox

Verschiedene Levels für die Praxis

Für die Ausführung bietet Bumblebee unterschiedliche Profile für Basis-, Projekt- und Tiefen-Scans. Dadurch sollen Entwickler abhängig vom jeweiligen Risiko flexibel reagieren können. Bei regelmäßigen Überprüfungen oder bekannten Meldungen könnten bereits oberflächliche Scans ausreichen, während bei bislang unbekannten Bedrohungen gezielte Analysen bestimmter Repositories oder Workspaces möglich sein sollen. Falls auch das nicht genügt, soll das Deep-Profil einen umfassenden Scan aktiver Sicherheitsvorfälle ermöglichen.

Perplexity sieht die wichtigsten Einsatzgebiete von Bumblebee insbesondere bei Sicherheitsingenieuren, DevSecOps-Teams sowie Unternehmen mit Entwicklern, die zahlreiche lokale Werkzeuge und Paket-Ökosysteme einsetzen. Besonders relevant sei das Werkzeug dort, wo kompromittierte Pakete möglichst schnell lokalisiert und bereinigt werden müssen.

Sicherer Einsatz vom Agenten soll vorangetrieben werden

Darüber hinaus unterstreicht Perplexity mit der Veröffentlichung von Bumblebee seine strategische Ausrichtung auf den sicheren Einsatz von KI-Agenten. Das gilt insbesondere vor dem Hintergrund, dass entsprechende Werkzeuge zunehmend stärker in Entwicklungs- und Geschäftsprozesse integriert werden.

Source link

Apps & Mobile Entwicklung

Anthropics Mythos: Release für Claude Code und Claude Security soll bevorstehen

Neue Hinweise sprechen dafür, dass die Veröffentlichung von Anthropics Cybersecurity-Werkzeug Mythos als Mythos 1 nicht mehr lange auf sich warten lassen dürfte. Darauf deuten inzwischen unter anderem Änderungen am Security-Dashboard für Unternehmenskunden hin. Ebenso soll Claude Opus 4.8 bereits in den Startlöchern stehen.

Mythos bislang nur als Vorschau und nur für ausgewählte Kreise

Einem Bericht von TestingCalatog zufolge scheint Anthropic seine Sicherheitslösung Mythos deutlich schneller für eine breitere Anwenderbasis öffnen zu wollen als ursprünglich angenommen. Noch Anfang April hatte das Unternehmen erklärt, das damals neue KI-Modell nicht offiziell veröffentlichen zu wollen. Hintergrund waren Erkenntnisse, wonach das Modell nicht nur außergewöhnlich leistungsfähig beim Auffinden und Ausnutzen von Sicherheitslücken sei, sondern auf Basis dieser Erkenntnisse ebenso problemlos passende Exploits erzeugen könne. Deshalb stellte Anthropic Mythos bislang lediglich als Vorschau für einen ausgewählten Kreis von Organisationen bereit, damit diese ihre eigenen Systeme mithilfe des Modells absichern können. Selbst das Bundesamt für Sicherheit in der Informationstechnik (BSI) warnte damals vor den möglichen Konsequenzen von KI-Modellen wie Mythos.

Mythos könnte mit entsprechenden Sicherheitsmaßnahmen veröffentlicht werden

Entsprechende Andeutungen zu einer möglichen Veröffentlichung von Mythos hatte Anthropic bereits am vergangenen Freitag in einem Update zu „Project Glasswing“ gemacht. An dem Sicherheitsprojekt sind unter anderem Amazon Web Services, Anthropic, Apple, Google, die Linux Foundation, Microsoft und Nvidia beteiligt. In dem Blogeintrag deutete das Unternehmen an, dass das KI-Modell künftig zum Schutz eines deutlich breiteren Spektrums an Organisationen beitragen soll. Dazu sollen unter anderem zahlreiche Open-Source-Projekte zählen. Gleichzeitig verdichteten sich Hinweise darauf, dass Modelle auf Mythos-Niveau künftig öffentlich zugänglich gemacht werden könnten, sobald die notwendigen Sicherheitsvorkehrungen getroffen wurden. Der Text lässt sich allerdings ebenso dahingehend interpretieren, dass diese Sicherheitsvorkehrungen erst durch noch leistungsfähigere KI-Modelle gewährleistet werden sollen, die Mythos künftig überwachen oder kontrollieren.

Für kurze Zeit waren in der Benutzeroberfläche von Claude Hinweise auf Mythos zu finden (Bild: TestingCatalog)

Immer mehr Hinweise werden öffentlich

Auch wenn Anthropic bei mehreren Punkten weiterhin vage bleibt, markiert die aktuelle Entwicklung dennoch eine überraschende Abkehr von der früheren Aussage, Mythos dauerhaft eingeschränkt halten zu wollen. Zwischenzeitlich sind bereits Teile des Modells über Lösungen zur Erkennung von Sicherheitslücken auf Google Cloud sowie Amazons Web Services (AWS) aufgetaucht. Hinzu kommen neue Hinweise auf ein Produkt namens Mythos 1 mit der Kennzeichnung „claude-mythos-1-preview“, das offenbar für Claude Code und Claude Security vorbereitet wird. Einige Anwender konnten entsprechende Hinweise bereits kurzzeitig in ihren Benutzeroberflächen entdecken. Zusätzlich fand sich im Quellcode mit „Zugriff auf das Claude-Mythos-Modell in Claude Code und Claude Security“ ein weiterer Verweis auf das neue Modell.

Auch bei Claude Security deuten sich Änderungen an

Parallel dazu soll Anthropic auch die Seite von Claude Security überarbeiten. Geplant sein soll unter anderem ein neues Dashboard, das entdeckte Schwachstellen, historische Diagramme über Zeiträume von sieben und dreißig Tagen sowie detailliertere Triage-Ergebnisse anzeigen kann. Hinweise darauf, dass Anthropic das neue Modell Unternehmenskunden bereits offiziell vorgestellt oder angeboten hat, gibt es derzeit allerdings noch nicht. Dennoch spricht inzwischen vieles dafür, dass der KI-Spezialist entsprechende Schritte vorbereitet.

Auch das Dashboard hat weitere Anzeigen bezüglich Cyber-Security erhalten (Bild: TestingCatalog)

Opus 4.8 bereits in den Startlöchern

Darüber hinaus verdichten sich die Hinweise darauf, dass Anthropic zugleich die Veröffentlichung von Claude Opus 4.8 vorbereitet. Ausgewählte Partner sollen bereits interne Evaluierungen des neuen KI-Modells durchführen. Eine Veröffentlichung in den kommenden Wochen würde zudem zum bisherigen Release-Zyklus passen, den Anthropic mit Opus 4.7 im April dieses Jahres vorgegeben hatte, und sich nahtlos in die aktuellen Entwicklungen rund um Mythos und Sicherheitsfunktionen einfügen.

Source link

Apps & Mobile Entwicklung

Dual-Mode-Speichersystem: Anthropic soll neues Speichermodell für Claude planen

Anthropic steht offenbar kurz davor, für Claude ein neues Speichersystem einzuführen. Dafür testet der KI-Spezialist angeblich bereits ein neues Modell, das künftig zwei unterschiedliche Systeme bieten soll. Der Vorteil der neuen Lösung bestünde unter anderem darin, gezielter auf gespeicherte Informationen zugreifen zu können.

Darüber berichtet das gewöhnlich sehr gut informierte Portal TestingCatalog. Demnach soll Anthropic grundlegende Änderungen daran vornehmen, wie Claude Informationen aus Gesprächen mit Anwendern über mehrere Sitzungen hinweg speichert, um diese später erneut für Aufgaben nutzen zu können.

Gedächtnis mit deutlich mehr Möglichkeiten

Im Raum steht derzeit ein neues System, bei dem Anthropic künftig auf zwei verschiedene Lösungen setzen soll, zwischen denen Anwender wählen können, die sich zugleich aber auch ergänzen sollen. Dem Bericht zufolge soll die bisherige Form der Informationsspeicherung künftig als „Classic“-Option geführt werden. Diese würde weiterhin alles, was Claude im Verlauf von Gesprächen über seinen Nutzer lernt, in einer einzigen Notiz zusammenfassen.

Die neue Speicherfunktion ist bereits in den Einstellungen aufgeführt (Bild: TestingCatalog)

Die neue Alternative mit der Bezeichnung „Memory Files“ soll die gesammelten Informationen dagegen auf mehrere strukturierte Dokumente verteilen, die nach Themen, Projekten oder Kontext organisiert sind. Dabei dürfte es sich wahrscheinlich um eine neue Version der zuvor entdeckten „Knowledge Bases“ handeln. Gleichzeitig sollen Anwender die gespeicherten Daten künftig jederzeit durchsuchen und bearbeiten können. Damit würde Anthropic einen Gegenentwurf zu den Persistent-Memory-Architekturen schaffen, auf die zahlreiche Konkurrenten zuletzt hingearbeitet haben. Im Unterschied zu diesen sollen Nutzer allerdings weiterhin selbst kontrollieren können, welche Informationen das Modell speichert.

Funktionsweise bereits von Agentenlösungen bekannt

Der von Anthropic gewählte Ansatz ist allerdings nicht neu, sondern kommt bereits bei dauerhaft aktiven agentenbasierten Lösungen wie OpenClaw und Hermes umfangreich zum Einsatz. Damit könnte künftig auch Claude auf ein Dateisystem-ähnliches Gedächtnis setzen, um über die Grenzen einer einzelnen fortlaufenden Zusammenfassung hinaus skalieren zu können. Die Aufteilung des Speichers in einzelne Dateien hätte zudem den Vorteil, Claude deutlich umfangreichere und langfristigere Aufzeichnungen zu jedem Nutzer zur Verfügung stellen zu können, ohne dabei das Kontextfenster zu überladen. Laut TestingCatalog könnte daraus in der Praxis eine Art integriertes persönliches Wiki entstehen, das der Assistent abhängig vom jeweiligen Gesprächsthema gezielt konsultieren kann.

Umsetzung könnte auch Einfluss auf andere Funktionen haben

Sollte Anthropic die genannten Pläne tatsächlich umsetzen, könnte dies zugleich bedeuten, dass „Dreams“ künftig auch für normale Endverbraucher verfügbar wird. Dabei handelt es sich um einen derzeit noch in der Beta-Phase befindlichen asynchronen Durchlauf durch sämtliche bislang gesammelten Speicherdateien. Die Funktion soll nicht nur in der Lage sein, Duplikate zusammenzuführen, sondern auch veraltete Einträge durch aktuelle Informationen zu ersetzen, Widersprüche aufzulösen und Muster zu erkennen, die das Modell während laufender Sitzungen übersehen hat. Der ursprüngliche Speicherbestand bleibt dabei unverändert, während parallel eine neu organisierte Version zur Überprüfung erstellt wird. Erst kürzlich hatte Anthropic die Funktion für seine Claude Managed Agents auf der Entwicklerplattform eingeführt.

„Dreams“ könnte ebenfalls für mehr Nutzer zur Verfügung gestellt werden (Bild: TestingCatalog)

Noch kein Startzeitpunkt bekannt

Ein konkreter Zeitpunkt für die Einführung ist bislang nicht bekannt. Dreams befindet sich nach wie vor in einer eingeschränkten Beta-Phase, die aktuell auf Opus 4.7 und Sonnet 4.6 begrenzt ist. Kleinere Anpassungen an der Benutzeroberfläche deuten jedoch darauf hin, dass Anthropic bereits einen öffentlichen Release vorbereiten könnte.

Anthropic will sich nach deren Aufholjagd wieder von Konkurrenz absetzen

Die neue Lösung kann zugleich als Versuch verstanden werden, verlorenen Boden gegenüber dem direkten Konkurrent OpenAI wieder gutzumachen. Das Unternehmen hatte zuletzt eine Erweiterung für Googles Chrome veröffentlicht, mit der der hauseigene Coding-Assistent direkt im Browser Aufgaben ausführen kann. Darüber hinaus steht eine Art Fernsteuerung für Codex im Raum. Zusätzlich will OpenAI das KI-Wettrüsten weiter anheizen und kündigte an, im Jahr 2026 rund 50 Milliarden US-Dollar in Infrastruktur und damit verbundene Rechenleistung investieren zu wollen.

Source link