Apps & Mobile Entwicklung

Trump-Regierung hebt Sperre auf: Anthropics Top-Modell Fable 5 kehrt heute zurück


Anthropics Top-Modell Fable 5 kehrt ab heute zurück, Mythos 5 soll bald wieder für weitere Organisationen freigegeben werden. Die Exportkontrollanordnung, mit der die Trump-Administration den Zugang zu den Modellen sperrte, hat das amerikanische Handelsministerium bereits aufgehoben.

Die Freigabe erfolgt heute im Laufe des Tages. Fable 5 ist dann weltweit über Claude Platform, Claude.ai, Claude Code und Claude Cowork verfügbar. Nutzer der Abo-Pläne Pro, Max, Team und ausgewählte Business-Pläne erhalten eine Woche lang ein um 50 Prozent erhöhtes Nutzungslimit für Fable 5. Danach greift das bekannte Credit-System, Nutzer müssen also Nutzungskapazitäten hinzubuchen.

Fable 5 ist die öffentliche Variante des Mythos-Modells, das Restriktionen in Bereichen wie Cybersicherheit und Biologie hat. Mythos 5 – also das Modell ohne Beschränkungen – ist seit letzter Woche bereits für eine Reihe von US-Organisationen freigeschaltet. Diese können es für das Absichern digitaler Infrastrukturen nutzen. Anthropic und die US-Regierung koordinieren sich nun, um weiteren amerikanischen und internationalen Organisationen einen Zugang zu geben.

Hintergründe zu Fable 5 und Mythos 5

Details zum Abkommen nennt die Trump-Administration nicht. „In den letzten zwei Wochen haben wir eng mit Anthropic zusammengearbeitet, um Fable 5 zu prüfen und freizugeben“, erklärt Handelsminister Howard Lutnick. Das erfolge im Rahmen einer abgestimmten Linie innerhalb der US-Regierung.

Neue Schutzmechanismen für Jailbreak – aber keine hundertprozentige Sicherheit

Hintergründe nennt Anthropic in einem Blog-Beitrag. Demnach war der Hinweis von Amazon für einen Fable-5-Jailbreak das Thema, das in den letzten Wochen von den Beteiligten diskutiert wurde. Anthropic hält diesen Jailbreak – ebenso wie Sicherheitsexperten – für nicht allzu gravierend. Damit lassen sich zwar Schutzmechanismen von Fable 5 aushebeln, das Modell findet aber keine Software-Fehler, die nicht auch frei verfügbare Modelle wie Claude Opus 4.8 oder GPT-5.5 entdecken würden.

  • Hinweis von Amazon: Wie es zur Sperre von Mythos 5 und Fable 5 kam

In Absprache mit Amazon und der Trump-Administration hat Anthropic nun Sicherheitsmechanismen entwickelt, die verhindern, dass sich die Restriktionen von Fable 5 mit so einem Jailbreak umgehen lassen. Ein neuer Sicherheitsklassifikator erkennt das Verhalten in 99 Prozent der Fälle und blockiert es. Die Konsequenz ist jedoch, dass das Modell nun häufiger harmlose Coding- und Debugging-Aufgaben als problematisch markiert und einen Wechsel auf schwächere Modelle erzwingt.

Wie scharf diese Klassifikatoren geschaltet sind, ist also sowohl für die Schutzmechanismen als auch die Fähigkeiten der Modelle entscheidend. Wie IT-Sicherheitsexperten anmerken, erklärt nun auch Anthropic: Es ist unmöglich, ein Modell zu 100 Prozent gegen Jailbreaks abzusichern.

Industrie-Leitfaden für das Bewerten von KI-Jailbreaks

Die zentrale Frage ist nun, wie KI-Unternehmen mit entsprechenden Hinweisen umgehen. Gemeinsam mit Amazon, Microsoft, Google und anderen Partnern aus dem Projekt Glasswing hat Anthropic nun einen Industrie-Leitfaden entwickelt. Bei der Bewertung von Jailbreaks basiert dieser auf vier Punkten:

  • Fähigkeitengewinn: Wie viel besser werden KI-Tools nach dem Jailbreak? Sind sie damit in der Lage, bisher frei verfügbare Tools zu übertreffen?
  • Reichweite der neuen Fähigkeiten: Für wie viele Aufgaben und Bereiche lässt sich der Jailbreak nutzen?
  • Waffentauglichkeit: Wie viel Aufwand müssen Menschen investieren, damit sich aus dem Jailbreak eine Waffe entwickeln lässt?
  • Auffindbarkeit: Wie schwer ist es, den Jailbreak zu entdecken?

Anhand dieser Kategorien sollen Jailbreaks eine Punktebewertung erhalten. Das Verfahren und der Umgang mit den Schutzmechanismen sind laut Anthropic jedoch ein Prozess, der weitere Arbeit erfordere.

Mehr Austausch mit der US-Administration

Verstärken will Anthropic zudem die Zusammenarbeit mit der US-Regierung. Neue leistungsfähige Modelle soll diese frühzeitig erhalten, um selbst die Fähigkeiten prüfen zu können. Details über Schutzmechanismen und Schwachstellen zu teilen, steht ebenfalls auf der Agenda.

Generell sei laut Anthropic das Ziel, beim Veröffentlichen von Modellen einen gemeinsamen Standard für KI-Entwickler zu etablieren.



Source link

Beliebt

Die mobile Version verlassen