Künstliche Intelligenz

Anthropic bringt „ehrlicheres“ Claude Opus 4.8 – und kündigt Mythos an


Was für Microsoft der Patch Tuesday, ist für Anthropic der Release Thursday: Claude Opus 4.8 ist ab sofort verfügbar – zum gleichen Preis wie Vorgänger Opus 4.7, der erst Mitte April freigegeben wurde. Wenig überraschend soll sich das neue Modell in Benchmarks für Coding, agentische Fähigkeiten, Reasoning und Wissensarbeit weiter verbessert haben, ist allerdings nicht in jeder Diziplin Benchmarksieger. Begleitend zum Modell-Update stellt das Unternehmen mehrere neue Funktionen bereit, die primär auf autonomes, großskaliges Arbeiten abzielen.

Weiterlesen nach der Anzeige



Ausgerechnet in einer der Paradediziplinen der Anthropic-Modelle muss sich Opus 4.8 OpenAIs GPT-5.5 geschlagen geben, wenn auch nur im Terminal Bench 2.1.

Laut Anthropic macht Opus 4.8 Unsicherheiten häufiger kenntlich und stellt seltener ungestützte Behauptungen auf als sein Vorgänger. In selbst geschriebenem Code lasse das neue Modell Fehler viermal seltener unkommentiert passieren als noch Opus 4.7.

Das hauseigene Alignment-Team bescheinigt dem Modell zudem angeblich neue Bestwerte bei sogenannten „prosozialen Eigenschaften“ – darunter die Unterstützung der Nutzerautonomie und das Handeln im Nutzerinteresse. Falsch ausgerichtetes Verhalten wie Täuschung oder Kooperation bei Missbrauch soll gegenüber Opus 4.7 deutlich seltener auftreten und auf dem Niveau des laut Anthropic bisher am besten ausgerichteten Modells, Claude Mythos Preview, liegen.

Neu ist die Funktion „Dynamic Workflows“, die in der Forschungsvorschau für Claude Code verfügbar ist. Damit soll Claude Code komplexe Aufgaben aufteilen, Hunderte parallele Subagenten in einer einzigen Sitzung starten und die Ergebnisse vor der Ausgabe prüfen können. Als Beispiel nennt Anthropic Codebase-weite Migrationen über Hunderttausende Zeilen Code – von der Aufgabenstellung bis zum fertigen Merge. Die Funktion steht Enterprise-, Team- und Max-Plänen zur Verfügung.

Weiterlesen nach der Anzeige

Nutzerinnen und Nutzer auf claude.ai erhalten mit Opus 4.8 eine neue Effort-Control-Funktion. Damit lässt sich direkt neben der Modellauswahl einstellen, wie viel Aufwand Claude in eine Antwort investieren soll – von schnelleren, ressourcenschonenderen Antworten bis zu tieferem Nachdenken für schwierige Aufgaben.

Der Fast Mode – bei dem Opus 4.8 mit 2,5-facher Geschwindigkeit arbeiten soll – ist im Vergleich zum Vorgängermodell um zwei Drittel günstiger. Der reguläre API-Preis bleibt unverändert: 5 US-Dollar pro Million Input-Token und 25 US-Dollar pro Million Output-Token. Im Fast Mode kostet es 10 beziehungsweise 50 US-Dollar.

Für Entwickler kommt eine neue API-Funktion hinzu: Die Messages API akzeptiert ab sofort System-Einträge innerhalb des Messages-Arrays. Damit ließen sich Anweisungen mitten in einer laufenden Aufgabe aktualisieren, ohne den Prompt-Cache zu unterbrechen.

Claude Opus 4.8 ist ab sofort über die API unter dem Modellnamen claude-opus-4-8 sowie auf claude.ai verfügbar.

Parallel zur Veröffentlichung von Opus 4.8 kündigt Anthropic an, Modelle der Mythos-Klasse in den nächsten Wochen für alle Kunden verfügbar zu machen. Die Entwicklung der nötigen Schutzmaßnahmen schreite zügig voran, heißt es seitens Anthropic.

Bislang ist Claude Mythos Preview nur einem sehr engen Kreis zugänglich. Im Rahmen von „Project Glasswing“ erhalten rund 40 weitere ausgewählte Unternehmen kritischer Infrastruktur Zugang, um ihre Systeme auf Schwachstellen zu prüfen. Der Plan, diesen Kreis auf rund 70 weitere Unternehmen auszuweiten, stieß auf Widerstand aus dem Weißen Haus – mit Verweis auf Sicherheitsbedenken und mögliche Kapazitätsengpässe.

Anthropic begründet die bisherige Zurückhaltung mit der außergewöhnlichen Leistungsfähigkeit des Modells beim Auffinden und Ausnutzen von Sicherheitslücken. Das KI-gestützte Schwachstellenscanner-Produkt Claude Security basiert dagegen auf dem weniger mächtigen Opus 4.7 und steht seit Ende April allen Enterprise-Kunden zur Verfügung.

Ende April hat OpenAI GPT-5.5 vorgestellt, das ebenfalls stark auf agentisches Arbeiten setzt. Metas Llama 4 kam im April als Open-Weight-Modell mit Mixture-of-Experts-Architektur – und dem Versprechen, dass sich Open-Source-Modelle langfristig durchsetzen werden. Ebenfalls als Open-Weights-Modell ist das europäische Mistral Medium 3.5 verfügbar, das Datensouveränität und Selbst-Hosting in den Vordergrund stellt und dabei mit nur vier GPUs auskommen soll.


(vza)



Source link

Beliebt

Die mobile Version verlassen