Apps & Mobile Entwicklung
Neues Spitzenmodell für ChatGPT: OpenAI verbessert GPT-5.4 bei autonomer Computersteuerung

OpenAI hat mit GPT-5.4 ein neues Spitzenmodell für ChatGPT vorgestellt. Während das erst zwei Tage zuvor präsentierte GPT-5.3 Instant vor allem die alltäglichen Chatgespräche verbessern soll, bietet GPT-5.4 mehr Leistungsfähigkeit in Bereichen wie Logikaufgaben, Reasoning und Agenten-Funktionen.
So bezeichnet OpenAI das neue Modell auch als „Spitzenmodell für professionelles Arbeiten“. Im Fokus stehen die Fortschritte bei komplexen und mehrstufigen Aufgaben. In Benchmarks wie GDPval, der die Agenten-Performance messen soll, kann sich GPT-5.4 deutlich vom Vorgänger absetzen. Dasselbe gilt für weitere Benchmarks, die OpenAI bereitstellt.
OpenAI setzt auch bei der Kontrolle des Modells an. Wenn man den Thinking-Modus nutzt, soll es bei komplexen Anfragen zunächst einen Plan präsentieren, den Nutzer dann anpassen können. Damit ist es möglich, den Output frühzeitig zu optimieren.
Die Halluzinationsrate hat OpenAI bereits mit GPT-5.3 Instant gesenkt. Mit GPT-5.4 soll die Fehlerrate ebenfalls geringer ausfallen. Optimiert wurde auch die Websuche.
State-of-the-Art-Computernutzung
Was OpenAI verbessert hat, ist die Computernutzung. Das Modell kann also besser Tools wie Browser oder Apps steuern. Vergrößert wurde auch das Kontextfenster, das nun bis zu einer Million Token unterstützt. Die Größe des Kontextfensters hat mit den Agenten enorm an Bedeutung gewonnen, weil dieser Wert beschreibt, wie viele Informationen das Modell innerhalb eines Prompts erfassen kann. Weil selbst mittelgroße Projekte schnell in Token-Grenzen laufen, bieten größere Kontextfenster bei mehrstufigen und komplexen Aufgaben einen Vorteil.
Profitieren soll die Alltagsarbeit auch von der erhöhten Effizienz. Im Vergleich zu GPT-5.2 löst GPT-5.4 Probleme mit deutlich weniger Token, was sich in schnelleren Antworten und geringeren Kosten für viele Workloads niederschlägt, heißt es in der Mitteilung von OpenAI.
Bereits in ChatGPT abrufbar
GPT-5.4 ist in ChatGPT als GPT-5.4 Thinking verfügbar, nutzen lässt es sich zudem über die API und das Agenten-System Codex. Zusätzlich stellt OpenAI neue Skills für Codex bereit – also eine Art Plug-in, das Agenten-Fähigkeiten speziell für bestimmte Aufgaben wie Präsentationen optimiert. Geschäftskunden können zudem die aktuelle Variante des Add-ins ChatGPT for Excel nutzen.
Codex-App für Windows verfügbar
Neben GPT-5.4 hat OpenAI auch die Codex-App für Windows veröffentlicht – bislang war OpenAIs Claude-Code-Konkurrent nur für MacOS verfügbar. Nutzer können damit das Agenten-System lokal vom Rechner aus per App starten und steuern, wobei die Modelle selbstverständlich nach wie vor in der Cloud berechnet werden.
Mit der Codex-App ist es laut OpenAI möglich, mehrere Agenten asynchron über verschiedene Projekte auszuführen. Die Fortschritte der Agenten lassen sich individuell prüfen.
Agenten-Systeme wie Codex und Claude richten sich derzeit vor allem noch an Programmierer. Fähigkeiten wie das Automatisieren von Routine-Aufgaben sind aber bereits außerhalb des Coding-Kosmos realisierbar. Ebenso bieten die Systeme Vorteile bei komplexen und mehrstufigen Aufgaben in Bereichen wie Datenanalysen.