Künstliche Intelligenz
Das wird teuer: Anthropics Claude Mythos 5 erscheint als Fable 5 mit Schranken
KI-Anbieter Anthropic strebt an die Börse, und für Börsenphantasie braucht es fabelhafte Möglichkeiten. Entsprechend heißt Anthropics neuestes Large Language Model (LLM) Claude Fable 5. Das hat der Anbieter außertourlich nicht am traditionellen Donnerstag, sondern schon am Dienstag veröffentlicht. Es soll „alles übertreffen, was wir jemals allgemein verfügbar gemacht haben”.
Weiterlesen nach der Anzeige
Der springende Punkt ist „allgemein verfügbar”, denn bei Fable 5 handelt es sich um eine inhaltlich eingeschränkte Variante des ebenfalls neuen Mythos 5. Dieses LLM wird, wie von Donald Trump als freiwillige Maßnahme angeordnet, vorerst nur der NSA und, wohl mit Zustimmung des Weißen Hauses, ausgewählte US-Unternehmen im Rahmen des IT-Sicherheitsprojekts Glasswing zur Verfügung gestellt.
Dahinter steckt die im LLM-Marketing bewährte Ansage, dass das neue Ding so enorm mächtig sei, dass eine Freigabe nicht infrage komme. Diesmal betrifft das nicht nur den Bereich IT-Sicherheit, sondern auch Biologie und Chemie sowie Distillation. Gemeint ist nicht die KI-gestützte Produktion geistiger Getränke, sondern das Extrahieren von Fertigkeiten: Andere LLM werden nicht mit Rohdaten, sondern anhand der Ausgaben bestehender LLM trainiert.
Classifier mit False Positives
Distillation kann legitim sein, etwa um eine kompaktere Variante eines LLM zu erzeugen, oder ein Angriff. Im Februar hat Anthropic die chinesischen Mitbewerber Deepthink, Minimax und Moonshot beschuldigt, Claude durch groß angelegte Distillation attackiert zu haben. Über 24.000 betrügerische Nutzerkonten hätten sie 16 Millionen Distillationsversuche unternommen. Dem will Anthropic Einhalt gebieten.
Unter anderem deswegen überwachen eigene, kleinere LLM („Classifier”) die Nutzereingaben. Das ist nicht grundsätzlich neu, doch reagiert Fable 5 in neuartiger Weise: Hält ein Classifier die Eingaben für verdächtig, verweigert er die Bearbeitung nicht, sondern schaltet auf die ältere Claude-Variante Opus 4.8 um. Das soll dem Nutzer auch angezeigt werden.
Im Netz gibt es bereits Beschwerden über Rückstufungen bei harmlosen Fragen, beispielsweise zur Interpretation eines Blutbildes. Solche false positives geben Anlass zu dem Vorwurf, Anthropic würde das nicht nur als Sicherheitsmaßnahme einsetzen, sondern auch um Serverüberlastung zu kaschieren. Opus 4.8 benötigt weniger Rechenkapazität als Fable 5.
In Zukunft dürfte es mindestens vier parallele Versionen von Claude Mythos geben: Eine vollständige für US-Behörden, eine für ausgewählte IT-Unternehmen mit weniger Einschränkungen für Sicherheitsbelange, eine für ausgewählte Wissenschaftler mit weniger Einschränkungen bei Biologie und Chemie, sowie Fable 5 für die zahlende Allgemeinheit.
Weiterlesen nach der Anzeige
Doppelte Preise
Claude Fable 5 ist grundsätzlich nicht in den Claude-Abonnements enthalten. Nur für 14 Tage dürfen Abonnenten (Pro, Max, Team sowie mit nach Kontoanzahl abgerechneten Enterprise-Verträgen) Fable 5 ausprobieren, verbrauchen dabei aber die doppelte Menge ihres Nutzungsrahmens. Ab 23. Juni soll Fable 5 ausschließlich nach jeweiliger Tokenmenge abgerechnet werden.
Die Tokenpreise (jeweils in US-Dollar) sind dann auch doppelt so hoch wie bei Claude Opus 4.8 und entsprechen damit dessen Fast-Variante: 10 Dollar pro Million Inputtoken, 12,50 Dollar je Million Token Cache Writes (5 Minuten), 20 Dollar je Million Token Cache Writes (1 Stunde), 1 Dollar je Million aus dem Cache gelesener Token, und 50 Dollar je Million Outputtoken.
300 Seiten Beipackzettel
Anthropic hat Claude Mythos 5 und Fable 5 dreizehn ausgewählten Benchmarks unterzogen. Laut der veröffentlichten Tabelle sticht das neue LLM alles bisher dagewesen bei elf Benchmarks aus. Bei den zwei übrigen liegt es geringfügig hinter der Vorschauvariante Claude Mythos Preview. Deren Classifier waren weniger streng.
Benchmarks laut Anbieter
(Bild: Anthropic)
Besonders stolz ist Anthropic auf die Leistung seines neuen LLMs bei Bilderkennung: „Fable 5 ist der Stand der Technik für Aufgaben, bei denen es auch um Sehen geht. Es kann präzise Zahlen aus detaillierten wissenschaftlichen Schautafeln extrahieren und komplexe bildabhängige Aufgaben ausführen, darunter den Nachbau des Quellcodes einer Web-App aus Screenshots”, heißt es in der Ankündigung. Auch ein Computerspiel habe Fable 5 besser absolviert als frühere Claude-Versionen.
Doch in mindestens einem Bereich hat Opus noch die Nase vorn: Mythos 5 und Fable 5 halluzinieren in manchen Tests mehr. Das und mehr verrät der Beipackzettel („Sytem Card”), der eigentlich ein 319 Seiten dickes Buch ist.
(ds)