Connect with us

Entwicklung & Code

Anthropic veröffentlicht Claude Mythos 5 als Fable 5 mit Einschränkungen


KI-Anbieter Anthropic strebt an die Börse, und für Börsenphantasie braucht es fabelhafte Möglichkeiten. Entsprechend heißt Anthropics neuestes Large Language Model (LLM) Claude Fable 5. Das hat der Anbieter außertourlich nicht am traditionellen Donnerstag, sondern schon am Dienstag veröffentlicht. Es soll „alles übertreffen, was wir jemals allgemein verfügbar gemacht haben”.

Weiterlesen nach der Anzeige

Der springende Punkt ist „allgemein verfügbar”, denn bei Fable 5 handelt es sich um eine inhaltlich eingeschränkte Variante des ebenfalls neuen Mythos 5. Dieses LLM wird, wie von Donald Trump als freiwillige Maßnahme angeordnet, vorerst nur der NSA und, wohl mit Zustimmung des Weißen Hauses, ausgewählte US-Unternehmen im Rahmen des IT-Sicherheitsprojekts Glasswing zur Verfügung gestellt.

Dahinter steckt die im LLM-Marketing bewährte Ansage, dass das neue Ding so enorm mächtig sei, dass eine Freigabe nicht infrage komme. Diesmal betrifft das nicht nur den Bereich IT-Sicherheit, sondern auch Biologie und Chemie sowie Distillation. Gemeint ist nicht die KI-gestützte Produktion geistiger Getränke, sondern das Extrahieren von Fertigkeiten: Andere LLM werden nicht mit Rohdaten, sondern anhand der Ausgaben bestehender LLM trainiert.

Distillation kann legitim sein, etwa um eine kompaktere Variante eines LLM zu erzeugen, oder ein Angriff. Im Februar hat Anthropic die chinesischen Mitbewerber Deepthink, Minimax und Moonshot beschuldigt, Claude durch groß angelegte Distillation attackiert zu haben. Über 24.000 betrügerische Nutzerkonten hätten sie 16 Millionen Distillationsversuche unternommen. Dem will Anthropic Einhalt gebieten.

Unter anderem deswegen überwachen eigene, kleinere LLM („Classifier”) die Nutzereingaben. Das ist nicht grundsätzlich neu, doch reagiert Fable 5 in neuartiger Weise: Hält ein Classifier die Eingaben für verdächtig, verweigert er die Bearbeitung nicht, sondern schaltet auf die ältere Claude-Variante Opus 4.8 um. Das soll dem Nutzer auch angezeigt werden.

Im Netz gibt es bereits Beschwerden über Rückstufungen bei harmlosen Fragen, beispielsweise zur Interpretation eines Blutbildes. Solche false positives geben Anlass zu dem Vorwurf, Anthropic würde das nicht nur als Sicherheitsmaßnahme einsetzen, sondern auch um Serverüberlastung zu kaschieren. Opus 4.8 benötigt weniger Rechenkapazität als Fable 5.

In Zukunft dürfte es mindestens vier parallele Versionen von Claude Mythos geben: Eine vollständige für US-Behörden, eine für ausgewählte IT-Unternehmen mit weniger Einschränkungen für Sicherheitsbelange, eine für ausgewählte Wissenschaftler mit weniger Einschränkungen bei Biologie und Chemie, sowie Fable 5 für die zahlende Allgemeinheit.

Weiterlesen nach der Anzeige

Claude Fable 5 ist grundsätzlich nicht in den Claude-Abonnements enthalten. Nur für 14 Tage dürfen Abonnenten (Pro, Max, Team sowie mit nach Kontoanzahl abgerechneten Enterprise-Verträgen) Fable 5 ausprobieren, verbrauchen dabei aber die doppelte Menge ihres Nutzungsrahmens. Ab 23. Juni soll Fable 5 ausschließlich nach jeweiliger Tokenmenge abgerechnet werden.

Die Tokenpreise (jeweils in US-Dollar) sind dann auch doppelt so hoch wie bei Claude Opus 4.8 und entsprechen damit dessen Fast-Variante: 10 Dollar pro Million Inputtoken, 12,50 Dollar je Million Token Cache Writes (5 Minuten), 20 Dollar je Million Token Cache Writes (1 Stunde), 1 Dollar je Million aus dem Cache gelesener Token, und 50 Dollar je Million Outputtoken.

Anthropic hat Claude Mythos 5 und Fable 5 dreizehn ausgewählten Benchmarks unterzogen. Laut der veröffentlichten Tabelle sticht das neue LLM alles bisher dagewesen bei elf Benchmarks aus. Bei den zwei übrigen liegt es geringfügig hinter der Vorschauvariante Claude Mythos Preview. Deren Classifier waren weniger streng.


Tabelle mit 13 Benchmarks für Mythos/Fable 5, Mythos Preview, Opus 4.8, GPT 5.5 und Gemini 3.1 Pro

Tabelle mit 13 Benchmarks für Mythos/Fable 5, Mythos Preview, Opus 4.8, GPT 5.5 und Gemini 3.1 Pro

Benchmarks laut Anbieter

(Bild: Anthropic)

Besonders stolz ist Anthropic auf die Leistung seines neuen LLMs bei Bilderkennung: „Fable 5 ist der Stand der Technik für Aufgaben, bei denen es auch um Sehen geht. Es kann präzise Zahlen aus detaillierten wissenschaftlichen Schautafeln extrahieren und komplexe bildabhängige Aufgaben ausführen, darunter den Nachbau des Quellcodes einer Web-App aus Screenshots”, heißt es in der Ankündigung. Auch ein Computerspiel habe Fable 5 besser absolviert als frühere Claude-Versionen.

Doch in mindestens einem Bereich hat Opus noch die Nase vorn: Mythos 5 und Fable 5 halluzinieren in manchen Tests mehr. Das und mehr verrät der Beipackzettel („Sytem Card”), der eigentlich ein 319 Seiten dickes Buch ist.


(ds)



Source link

Entwicklung & Code

Open Knowledge Format: KI-Wissen als Markdown-Dateien


Google Cloud hat mit dem Open Knowledge Format (OKF) eine offene Spezifikation vorgestellt, die Kontextwissen für KI-Systeme und Agenten plattformübergreifend nutzbar machen soll. Das Format richtet sich an Unternehmen, die Metadaten, Dokumentationen, Runbooks oder fachliche Definitionen zentral für den KI-Einsatz bereitstellen wollen. Google hat die Unterstützung für OKF bereits in den eigenen Knowledge Catalog integriert.

Weiterlesen nach der Anzeige

Mit dem Format greift Google einen Ansatz auf, der sich unter Entwicklern von KI-Agenten in den vergangenen Monaten verbreitet hat. Statt Agenten immer wieder dieselben Informationen aus Wikis, Datenkatalogen oder Dokumentationen heraussuchen zu lassen, legen Teams ihr Wissen strukturiert als Sammlung von Markdown-Dateien ab. KI-Forscher Andrej Karpathy hat dieses Muster als „LLM Wiki“ beschrieben. Verwandte Konzepte stecken in Obsidian-Vaults, in Konfigurationsdateien für Agenten wie AGENTS.md oder CLAUDE.md sowie in sogenannten „Metadata as Code“-Repositories.

Diese Ansätze nutzen zwar ähnliche Bausteine – Markdown-Dateien, Metadatenfelder und Querverweise –, bleiben aber meist auf einzelne Teams, Werkzeuge oder Anbieter beschränkt. Wissen lässt sich so kaum zwischen verschiedenen KI-Systemen wiederverwenden. Genau hier setzt Google an: OKF soll die nötigen Konventionen festlegen, mit denen unterschiedliche Werkzeuge dieselben Wissensbestände lesen und schreiben können – ohne Übersetzungsschicht und ohne herstellereigenes SDK.

Ein OKF-Bundle besteht aus einem Verzeichnis von Markdown-Dateien. Jede Datei beschreibt genau ein Konzept, etwa eine Datenbanktabelle, einen Datensatz, eine API, eine Geschäftsmetrik, ein Runbook oder ein Playbook. Das YAML-Frontmatter enthält strukturierte Felder wie type, title, description, resource, tags und timestamp.

Die einzelnen Dateien verknüpfen sich über gewöhnliche Markdown-Links. So entsteht ein Wissensgraph, der die Beziehungen zwischen den Konzepten abbildet. Die Dokumentation einer Bestelltabelle kann etwa auf Kunden- und Produktdaten sowie auf die Definition einer Umsatzkennzahl verweisen. Ein KI-Agent bekommt damit nicht nur einzelne Dokumente, sondern auch deren fachliche Zusammenhänge.

Weiterlesen nach der Anzeige

Google beschreibt in der Ankündigung OKF ausdrücklich als Format und nicht als Plattform. Die Spezifikation soll unabhängig von Cloud-Anbietern, Datenbanken, KI-Modellen oder Agenten-Frameworks funktionieren. Den Standard halten die Entwickler bewusst schlank: Verpflichtend ist allein ein Typfeld, alle weiteren Strukturen und Metadaten dürfen die Anwender selbst festlegen. OKF schreibt damit nur die Interoperabilität vor, nicht aber ein einheitliches Inhaltsmodell.

Zusammen mit der Spezifikation liefert Google mehrere Referenzimplementierungen aus. Dazu zählt ein Enrichment-Agent für BigQuery, der Tabellen und Views analysiert und daraus automatisch OKF-Dokumente erzeugt. In einem zweiten Durchlauf reichert ein Sprachmodell die Dokumente um Schemainformationen, Dokumentation, Quellenangaben und Join-Beziehungen an. Hinzu kommt ein statischer HTML-Viewer, der einen OKF-Bestand als interaktiven Wissensgraphen darstellt, ganz ohne Backend.

Zum Ausprobieren stellt Google Beispielbestände für Datensätze aus GA4 E-Commerce, Stack Overflow und öffentlichen Bitcoin-Datensätzen bereit. Spezifikation, Beispielcode und Referenzimplementierungen liegen auf GitHub.

Die Spezifikation liegt bislang in Version 0.1 vor. Google bezeichnet sie als Ausgangspunkt und will sie gemeinsam mit der Community rückwärtskompatibel weiterentwickeln. Produzenten und Konsumenten des Formats – etwa Datenkataloge, Suchsysteme oder KI-Agenten – sollen dabei unabhängig voneinander entstehen.


(fo)



Source link

Weiterlesen

Entwicklung & Code

US-Regierung erzwingt Abschaltung von Anthropics KI Fable 5 und Mythos 5


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Anthropic muss seine KI-Modelle Fable 5 und Mythos 5 für alle Kunden weltweit abschalten. Auslöser ist nach Darstellung des Unternehmens eine Exportkontrolldirektive der US-Regierung, die am 12. Juni 2026 eingegangen sei und ausländischen Staatsangehörigen den Zugriff auf beide Modelle untersagt – auch ausländischen Anthropic-Mitarbeitern innerhalb der USA. Alle übrigen Claude-Modelle seien von der Anordnung nicht betroffen. Die Maßnahme reiht sich in eine bereits zuvor eskalierte Auseinandersetzung zwischen Anthropic und Teilen der US-Sicherheitsbürokratie ein.

Weiterlesen nach der Anzeige

Wie Anthropic in einer Stellungnahme erklärt, habe die Behörde keine konkreten technischen Details zu den angeführten nationalen Sicherheitsbedenken genannt. Nach dem Verständnis des Unternehmens geht die Regierung davon aus, dass eine Methode existiere, um Fable 5 zu „jailbreaken“, also dessen Schutzmechanismen zu umgehen. Anthropic bezeichnet die Maßnahme als „Missverständnis“ und arbeitet an der Wiederherstellung des Zugangs.


Screenshot der Startseite von Claude.

Screenshot der Startseite von Claude.

Beim Start von Claude verweist Anthropic auf die Erklärung, warum Fable 5 derzeit für alle Kunden deaktiviert ist.

Die beanstandete Technik beschreibt Anthropic als verbal überlieferten, potenziell nicht-universellen Jailbreak. Im Kern bestehe er darin, das Modell anzuweisen, eine bestimmte Codebasis zu lesen und Softwarefehler zu beheben. Eine Demonstration dieser Technik habe man geprüft und dabei lediglich eine kleine Zahl bereits bekannter, geringfügiger Schwachstellen gefunden, die auch andere öffentlich verfügbare Modelle aufspüren könnten – das Unternehmen nennt in diesem Zusammenhang ausdrücklich OpenAIs GPT-5.5.

Aus Sicht von Anthropic handelt es sich dabei um eine alltägliche Fähigkeit, wie sie Sicherheitsfachleute täglich bei legitimen Code-Reviews und beim Bugfixing nutzen. Der entscheidende Unterschied liege nicht in der Funktion selbst, sondern im Kontext: Derselbe Vorgang könne in einem Sicherheitsreview erwünscht sein, in einem anderen Szenario aber als potenzieller Missbrauch gewertet werden. Einen universellen Jailbreak, der die Schutzmechanismen von Fable 5 grundsätzlich aushebelt, habe man bislang nicht gefunden.

Anthropic verweist auf eine sogenannte „Defense-in-Depth-Strategie“: Jailbreaks sollen entweder eng begrenzt oder sehr aufwendig sein und werden durch Monitoring ergänzt, das erfolgreiche Angriffe schnell erkennen soll. Für Fable 5 gelte zudem eine 30-tägige Datenspeicherungspflicht, um Umgehungsversuche analysieren und eindämmen zu können. Unser Test von Fable 5 bestätigt, dass Anthropic Classifier vor das eigentliche Modell schaltet und bei heiklen Eingaben teils auf das Vorgängermodell Opus 4.8 zurückfällt.

Weiterlesen nach der Anzeige

Die zuvor kommunizierten Schutzmaßnahmen seien in einer Vorabprüfung über Tausende Stunden Red-Teaming getestet worden – gemeinsam mit der US-Regierung, dem britischen AI Safety Institute (UK AISI), privaten Organisationen und internen Teams. Die Ergebnisse hätten deutlich über denen früherer Modelle gelegen. Eine vollständig unabhängige Auditierung, etwa durch europäische Forschungseinrichtungen, ist nach derzeitigem Stand allerdings nicht belegt: Eine komplette Offenlegung der Schutzlogik oder der internen Classifier-Architektur gab es nicht. Während Fable 5 mit zusätzlichen Schutzmechanismen für die öffentliche Nutzung versehen wurde, gilt Mythos als restriktivere Variante.

Anthropic räumt ein, dass perfekte Jailbreak-Resistenz für kein Modell erreichbar sei. Zugleich widerspricht das Unternehmen der Auffassung, dass ein einzelner „unwahrscheinlicher Jailbreak den Widerruf eines kommerziellen Modells mit Hunderten Millionen Nutzern rechtfertige“. Würde man diesen Maßstab branchenweit anlegen, käme das einem Stopp neuer Frontier-Modelle gleich.

Die jetzige Anordnung trifft auf ein bereits angespanntes Verhältnis. Anfang März 2026 hatte das US-Verteidigungsministerium Anthropic als „supply chain risk“ eingestuft. In einem aktuellen Blogbeitrag erklärte CEO Dario Amodei, man halte die Einstufung als „supply chain risk“ für rechtlich nicht tragfähig und wolle sie vor Gericht anfechten. Der zugrunde liegende US‑Statut 10 U.S.C. § 3252 sei eng auf spezifische Lieferkettenrisiken bei nationalen Sicherheitssystemen zugeschnitten und verlange, dass das Ministerium darlegt, warum weniger eingriffsintensive Maßnahmen („less intrusive measures“) nicht vernünftigerweise zur Verfügung stehen.

Der Konflikt drehte sich nach Anthropics Darstellung um die Weigerung, Claude uneingeschränkt für massenhafte inländische Überwachung und vollautonome Waffensysteme freizugeben. Ob die aktuelle Exportdirektive primär eine Sicherheitsmaßnahme oder politischer Druck auf einen renitenten Anbieter ist, lässt sich aus den veröffentlichten Quellen nicht beweisen. Plausibel erscheint jedoch, dass der vorangegangene Streit das Verhältnis erheblich verschlechtert und die Eskalation begünstigt hat.

Für hiesige Anbieter ist ein direkt vergleichbarer, einzelmodellbezogener Eingriff in der EU nicht ersichtlich. Während das US-Exportkontrollrecht auf außenwirtschaftliche Zugriffssperren zielt, verfolgt der EU AI Act einen risikobasierten Ansatz mit Marktaufsicht, Transparenz- und Dokumentationspflichten. In Deutschland soll die Bundesnetzagentur die zentrale Marktüberwachungsbehörde werden; den entsprechenden Gesetzentwurf (KI-MIG) hat der Bundestag am 11. Juni 2026 beschlossen, die Zustimmung des Bundesrats steht noch aus. Eine globale Abschaltung eines einzelnen Modells als Maßnahme der Exportkontrolle ist in dieser Logik so nicht vorgesehen.

Lesen Sie auch


(vza)



Source link

Weiterlesen

Entwicklung & Code

App Store: Entwickler dürfen Nutzer künftig beim Kündigen ansprechen


Abseits der viel beachteten Neuerungen rund um KI, Siri und die Betriebssysteme hat Apple im Zuge der Entwicklerkonferenz WWDC auch eine ganze Reihe von Neuheiten und Änderungen für App Store-Entwickler angekündigt. Künftig können erstmals Gruppenkäufe für Abonnenten und entwicklerübergreifende Bundles angeboten werden. Im Mac App Store entfällt die Intel-Pflicht und Entwickler bekommen die Möglichkeit, Nutzer zur Fortsetzung eines Abos zu bewegen. Zudem gibt es mehr Gestaltungsmöglichkeiten für den Auftritt im App Store und neue Auskunftspflichten. Das aus Nutzersicht umstrittenste neue Feature dürfte das sogenannte Retention Messaging werden. Apple bietet neue Werkzeuge in App Store Connect an, um Abonnenten mit Kündigungsabsicht über Apples Abo-Plattform ansprechen zu können. Bereits im März hatte Apple den Analytics-Bereich in App Store Connect massiv erweitert und Entwicklern dabei über 100 neue Metriken für Abonnements und In-App-Käufe an die Hand gegeben. Laut Ankündigung sollen personalisierte Nachrichten und Sonderangebote möglich sein.

Weiterlesen nach der Anzeige

Ganz neue Vermarktungsmöglichkeiten für Apps ergeben sich durch entwicklerübergreifende App-Bundles. Bislang konnte nur ein einzelner Entwickler, der mehrere Apps anbietet, ein vergünstigtes Paket mit mehreren Apps schnüren. Künftig ist das auch für mehrere Entwickler möglich, sodass sich diese bei den Apps zusammentun können. Apple führt zudem ab Winter 2026 Gruppenkäufe für Abonnements ein. Ein einzelner Abonnent kann damit Lizenzen für mehrere Personen in einem einzigen Kauf erwerben.

Apples Abkehr von der Intel-Plattform im neuen macOS Golden Gate schlägt sich auch im Mac App Store nieder: Künftig ist es für App-Entwickler keine Pflicht mehr, Intel-Unterstützung vorzuhalten. Dies dürfte in einigen Fällen dazu beitragen, dass Besitzer eines Intel-Macs eher in die Situation geraten, den Umstieg auf einen Apple-Silicon-Mac erwägen zu müssen – etwa wenn häufig genutzte Apps künftig nicht mehr den Intel-Mac unterstützen. Wann genau Intel-Apps unter Apple Silicon nicht mehr laufen werden und was das Ende von Rosetta 2 für Nutzer bedeutet, erklärt unser Überblick zum Zeitplan des Intel-Supports.

Vereinfachungen und Erweiterungen gibt es beim App-Marketing. Die neuen Betriebssysteme, darunter iOS 27 und macOS 27, stehen Entwicklern bereits als Beta zur Verfügung. In einer neuen Asset Library können Grafiken, Vorschauvideos und Screenshots zentral verwaltet werden. Diese Assets können nun auch unabhängig von einem App-Update zur Prüfung eingereicht werden – und Apple öffnet die Produktseiten-Header für eigenes Bild- und Videomaterial. Neue „Personalized Collections“ sollen maßgeschneiderte App-Empfehlungen für Nutzer ermöglichen. Diese Funktion startet zunächst auf Englisch in den USA.

Und Apples angekündigte erweiterte Jugendschutzfunktionen wirken sich auch auf die Entwickler aus. Diese müssen Social-Feed-Funktionen in ihren Apps künftig angeben. Zudem werden Apps in die neuen Nutzungszeit-Kategorien (Soziale Netzwerke, Unterhaltung, Spiele, Andere) eingruppiert. Der Altersfreigabe-Fragebogen soll hierfür ab Juli aktualisiert werden.

Weiterlesen nach der Anzeige


(mki)



Source link

Weiterlesen

Beliebt