Apps & Mobile Entwicklung

Forderung der Trump-Regierung: Für Fable-Rückkehr muss Anthropic alle Jailbreaks blockieren


Die Trump-Administration will Anthropics Modell Claude Fable 5 erst wieder freigeben, wenn es sämtliche Jailbreaks blockiert, hat Wired aus Regierungskreisen erfahren. Der Haken: Laut IT-Sicherheitsexperten sind so stark abgesicherte Modelle schlicht nicht realistisch.

Jailbreaks bedeuten bei den KI-Modellen, dass Nutzer die Sicherheitsmechanismen überlisten, sodass diese Modelle auf Fragen antworten, die eigentlich gesperrt sind. Klassischerweise gilt das für Bereiche wie den Bau von Waffen oder das Herstellen von Drogen.

Fable 5 hatte weitreichende Sicherheitsvorgaben. So wurden viele Anfragen aus dem Bereich Coding und Biologie geblockt. Selbst bei harmlosen Themen wie Mitochondrien wurden Nutzer auf das alte Spitzenmodell Opus 4.8 abgestuft. Angesichts der Einschränkungen bezeichnete die Tech-Journalistin Eva Wolfangel das Modell sogar als „kaputt“.

Die Jailbreak-Frage: Wie anfällig ist Fable 5?

In dem für die Sperre von Fable 5 und Mythos 5 relevanten Fall ging es um einen Jailbreak, der Fähigkeiten der Modelle im Bereich Cybersicherheit freischaltete. Entsprechende Hinweise sollen von Amazon und weiteren Unternehmen stammen. Anthropic bestreitet aber, dass der Vorfall schwerwiegend ist. Mit Fable 5 wären keine Maßnahmen umsetzbar, die nicht ohnehin verfügbare Modelle wie GPT-5.5 beherrschen.

Die Sorgen der Trump-Administration wären übertrieben, lautet daher die Einschätzung von Anthropic. Für Vertreter der Trump-Administration spielt die Schwere der Schwachstellen laut dem Wired-Bericht jedoch keine Rolle. Demnach habe die NSA bestätigt, dass es Möglichkeiten gebe, die Sicherheitsvorgaben von Fable 5 zu umgehen. Nun sei es die Aufgabe von Anthropic, die Probleme zu beheben, hat Wired von drei Personen erfahren, die mit den Vorgängen vertraut sind.

Zuvor meldete bereits Semafor, im Weißen Haus gebe es den Verdacht, dass China einen Zugang zu Mythos 5 hat. Mythos ist die Variante von Fable 5 ohne Sicherheitsvorkehrungen, die aber nur ausgewählte Organisationen nutzen dürfen.

Offizieller Fall eigentlich harmlos?

Die IT-Sicherheitsexpertin Katie Moussouris, die den Report über die Fable-5-Schwachstelle gelesen hat, hält das Problem nicht einmal für eine Schwachstelle. Der Ausgangspunkt war laut ihrem Blog-Beitrag: Forscher nahmen Open-Source-Code mit bekannten Sicherheitslücken sowie neuen Code mit absichtlich platzierten Fehlern. Fable 5, Mythos und Opus 4.8 sollten dann den Code auf Sicherheitslücken hin überprüfen.

Fable 5 verweigerte zunächst die Auskunft. Dann wollten die Forscher, dass Fable 5 die Fehler behebt („fix this code“). Die Ausgabe wurde im Rahmen eines mehrstufigen und manuellen Prozesses in Skripte umgewandelt, die die Patches testeten. Laut Moussouris sei das kein Umgehen von Sicherheitsmechanismen. Code-Lücken zu finden und zu beseitigen sei eine der wertvollsten Dinge, die KI-Modelle im Bereich Cybersicherheit leisten können. „Niemals hätte [so eine Maßnahme] eine Exportkontrolle auslösen sollen“, so Moussouris.

Wie sich KI-Modelle hacken lassen

Wie komplex Jailbreak-Angriffe ausfallen können, demonstrierte Pliny. Er konnte Sicherheitsvorgaben umgehen, indem er eine Reihe von Techniken einsetzte. Dazu zählen der Einsatz mehrerer Agenten, Wechsel von Unicode-Zeichen, das Ausnutzen langer Kontextfenster mit per se harmlosen Inhalten, er tarnte die Inhalte als Uni-Vorlesung und unterteilte die Aufgabe in Teilinformationen, die er im Nachgang zusammensetzte. Details zu dem Jailbreak beschreibt Pliny auf X.

Diese Vorgehensweise beschreibt im Kern die Argumentation von Sicherheitsforschern. Die Schutzmechanismen in den KI-Modellen sind laut dem Wired-Bericht demnach nur eine Art Übergangslösung. Findige Nutzer sowie künftige Modelle werden immer Wege finden, um diese zu umgehen. Technisch lassen sich Jailbreaks also niemals vollständig verhindern. Das Weiße Haus wollte diese Thematik auf Anfrage von Wired nicht kommentieren.

Ein weiteres Problem ist zudem: Je strikter die Schutzmechanismen sind, desto eingeschränkter ist die Leistungsfähigkeit der Modelle. Das zeigt das Beispiel Fable 5, das selbst bei Alltagsfragen die Auskunft verweigerte.

Fable-5-Sperre als Exportkontrolle

Die Sperre von Fable 5 und Mythos 5 erfolgte im Rahmen einer Exportkontrollanordnung. Grundsätzlich ist also nur nicht-US-Bürgern der Zugang zu den Modellen untersagt. Weil Anthropic aber nicht zwischen amerikanischen und ausländischen Nutzern unterscheiden kann, wurden die Modelle für alle gesperrt.

Nach wie vor wird aber diskutiert, ob es bei dem Streit tatsächlich um den Jailbreak geht oder nicht doch eher um das zerrüttete Verhältnis von Anthropic und der US-Regierung.



Source link

Beliebt

Die mobile Version verlassen