Apps & Mobile Entwicklung
Mythos 5 nur für ausgewählte Partner: Anthropics Fable 5 ist so mächtig, dass es in Ketten muss
Anthropic hat zwei neue KI-Modelle vorgestellt, die die Leistungsfähigkeit öffentlich zugänglicher Systeme auf ein neues Niveau heben sollen. Mit Mythos 5 veröffentlicht das Unternehmen erstmals ein Modell, das nach eigenen Angaben Fähigkeiten der bislang intern als besonders risikoreich eingestuften „Mythos-Klasse“ besitzt.
KI-Modell mit neuem Leistungsniveau
Eigenen Angaben zufolge übertrifft Claude Fable 5 sämtliche bislang allgemein verfügbaren Modelle von Anthropic. Das gelte insbesondere für komplexe Aufgaben, die mehrere Arbeitsschritte erfordern oder über längere Zeiträume bearbeitet werden müssen. Hier soll sich Fable 5 deutlich von den Vorgängern absetzen. Besonders hervor hebt das Unternehmen dabei Anwendungen in der Softwareentwicklung, wissenschaftlichen Forschung, Datenanalyse, Wissensarbeit sowie beim visuellen Verständnis von Bildern und Dokumenten.
Mehr Leistung birgt auch mehr Risiken
Anthropic sieht Fable 5 derzeit in nahezu allen relevanten Benchmarks als das aktuelle Maß der Dinge, räumt jedoch zugleich ein, dass die Leistungssteigerung neue Risiken mit sich bringe, die bei bisherigen Modellen in dieser Form noch nicht bestanden hätten. Entsprechend geht das Unternehmen in der Ankündigung nicht nur auf die Verbesserungen, sondern auch auf potenzielle Missbrauchsmöglichkeiten ein.
KI-Systeme dieser Leistungsklasse seien inzwischen in Bereichen angekommen, in denen sie Kriminellen oder anderen Akteuren einen echten praktischen Vorteil verschaffen könnten. Als Beispiele nennt Anthropic in der Ankündigung die Suche nach und Ausnutzung von Schwachstellen in Software, die Unterstützung komplexer Cyber-Angriffe, bestimmte biologische und chemische Forschungsfragen sowie die sogenannte Modell-Destillation, also den Versuch, die Fähigkeiten eines KI-Systems für den Aufbau konkurrierender Modelle zu kopieren. Dabei handele es sich aus Sicht des Unternehmens nicht mehr nur um theoretische Risiken, sondern um reale Gefahren, die besondere Schutzmaßnahmen erforderlich machten.
Diese seien nicht zuletzt deshalb notwendig, weil Modelle der Mythos-Klasse inzwischen in der Lage seien, Schwachstellen in Software zu identifizieren, Angriffswege zu entwickeln und verschiedene Phasen eines Cyber-Angriffs zu unterstützen. Zu den Risiken sollen unter anderem Aufklärung und Informationsbeschaffung, die Identifikation von Schwachstellen, die Entwicklung von Exploits, laterale Bewegungen innerhalb kompromittierter Netzwerke sowie weitere Bestandteile sogenannter agentischer Cyber-Angriffe zählen.
Sicherheitsvorkehrungen können bislang nicht umgangen werden
Um Missbrauch zu verhindern, wurden neue Sicherheitsmechanismen entwickelt und umfangreichen internen wie externen Tests unterzogen. Anthropic berichtet von mehr als 1.000 Stunden externer Sicherheitsprüfungen, bei denen keine universell funktionierende Umgehungsmethode gefunden worden sei. Gleichzeitig räumt das Unternehmen aber unumwunden ein, dass absolute Sicherheit nicht erreichbar sei und daher auch nicht garantiert werden könne. Ziel sei es vielmehr, Umgehungsversuche so aufwendig zu gestalten, dass sie rechtzeitig erkannt und gestoppt werden können, bevor sie in größerem Umfang eingesetzt werden oder Schaden anrichten können.
Anthropic gibt zwar an, dass auch harmlose Anfragen gelegentlich die eher konservativ ausgelegten Sicherheitsvorkehrungen auslösen könnten, den eigenen Untersuchungen zufolge liege die Quote jedoch bei lediglich 5 Prozent der Sitzungen.
Ausgebaute wissenschaftliche Fähigkeiten
Neben den Sicherheitsaspekten hebt Anthropic in der Ankündigung die wissenschaftlichen Fähigkeiten der neuen Modellgeneration hervor. Als Beispiel nennt das Unternehmen eine Aufgabe aus der Gentherapie-Forschung, bei der das Modell Eigenschaften genetisch veränderter Virushüllen vorhersagen sollte. Dabei soll Mythos 5 sogar spezialisierte Proteinmodelle übertroffen haben, obwohl es für diese Aufgabe nicht gezielt trainiert worden sei. Dies könnte sich erheblich auf die Entwicklung neuer Therapien und Medikamente auswirken, in der Anthropic großes Potenzial sieht.
Gleichzeitig weist Anthropic jedoch darauf hin, dass dieselben Fähigkeiten theoretisch auch für problematische biologische Forschung genutzt werden könnten. Auf dieses Problem haben bereits in den vergangenen Wochen zahlreiche KI-Unternehmen und Forscher in einem an die US-Regierung gerichteten öffentlichen Brief hingewiesen, in dem neue gesetzliche Vorgaben zur Kontrolle synthetischer DNA und RNA gefordert wurden.
Als zusätzliche Schutzmaßnahme werden derzeit nahezu alle Anfragen aus den Bereichen Biologie und Chemie automatisch an das schwächere Opus-Modell 4.8 weitergeleitet. Langfristig plant Anthropic, die Schutzmechanismen auszubauen und zugleich präziser zu gestalten, um wissenschaftliche Anwendungen weniger stark einzuschränken.
Weitere neue Sicherheitsmechanismen
Ein weiterer Schwerpunkt der Ankündigung betrifft die sogenannte Destillation, bei der die Funktionsweise eines KI-Modells für andere Systeme kopiert werden soll. Laut Anthropic habe es in der Vergangenheit bereits Versuche gegeben, Claude-Modelle systematisch auszulesen, um daraus konkurrierende Systeme zu entwickeln. Da Fable 5 deutlich leistungsfähiger als frühere Modelle sei, sieht das Unternehmen in einem Nachbau die Gefahr, dass dort die jeweiligen Schutzmechanismen entfernt werden und dies die Verbreitung von Hochleistungs-KI zusätzlich beschleunigen könnte. Entsprechende Anfragen sollen daher durch die neuen Klassifizierer erkannt und eingeschränkt werden.
Mit der Einführung von Modellen der Mythos-Klasse verschärft Anthropic zudem die Richtlinien zur Datenspeicherung. Um die genannten Sicherheitsanforderungen erfüllen zu können, werden künftig sämtliche Eingaben und Interaktionen mit Fable 5, Mythos 5 und ähnlichen Modellen für 30 Tage gespeichert. Dies soll ausschließlich Sicherheitszwecken dienen, die gespeicherten Daten würden weder für das Training noch für andere kommerzielle Zwecke verwendet. Zudem werde jeder menschliche Zugriff auf diese Daten protokolliert.
Mythos nach wie vor nicht öffentlich
Enttäuscht dürften zahlreiche Anwender sein, die nach den bislang wiederholt vage formulierten Aussagen von Anthropic zu Claude Mythos gehofft hatten, zumindest einen eingeschränkten Zugriff auf das auf Cyber-Sicherheit spezialisierte KI-Modell des Unternehmens zu erhalten. Offenbar sind die dafür erforderlichen Sicherheitsmechanismen nach Einschätzung von Anthropic noch nicht weit genug entwickelt, um eine Veröffentlichung für die breite Öffentlichkeit zu ermöglichen. Dennoch handelt es sich bei dem nun vorgestellten Mythos 5 bereits um eine „abgeschwächte“ Version, obwohl technisch dasselbe Basismodell zum Einsatz kommt, allerdings mit deutlich mehr Einschränkungen in sensiblen Bereichen.
Zugang erhalten daher zunächst Teilnehmer des „Project Glasswing“, das gemeinsam mit US-Behörden und Cyber-Sicherheitsorganisationen betrieben wird. Zu einem späteren Zeitpunkt sollen weitere Organisationen über ein breiter angelegtes „Trusted Access Program“ Zugang zu Mythos 5 erhalten. Darüber hinaus plant Anthropic ein separates Programm für Forscher aus den Lebenswissenschaften, die die biologischen Fähigkeiten des Modells nutzen möchten.
Preise und Verfügbarkeit
Anthropic stellt Fable 5 ab heute bis zum 22. Juni in den Tarifen Pro, Max, Team sowie den lizenzbasierten Enterprise-Tarifen ohne zusätzliche Kosten bereit. Sollten es die verfügbaren Kapazitäten zulassen, erwägt das Unternehmen eine Verlängerung des genannten Zeitraums. Andernfalls wird Anthropic beide Modelle zu identischen Preisen anbieten. In diesem Fall verlangt der KI-Spezialist sowohl für Fable 5 als auch für Mythos 5 jeweils 10 US-Dollar pro eine Million Eingabe-Tokens und 50 US-Dollar pro eine Million Ausgabe-Tokens. Laut Anthropic liegen die Kosten damit bei weniger als der Hälfte der bisherigen Mythos-Preview-Modelle. Fable 5 ist ab sofort verfügbar, während Mythos 5 weiterhin ausgewählten Partnern vorbehalten bleibt.
Sobald die verfügbaren Kapazitäten es zulassen, soll Fable 5 wieder fester Bestandteil der Abonnement-Tarife werden.