Apps & Mobile Entwicklung
Lokales KI-Modell aus China: GLM-5.2 verdrängt Claude Fable 5 bei Web-Design von der Spitze
Das chinesische KI-Modell GLM-5.2 hat sich überraschend an die Spitze der Design-Arena-Rangliste für HTML-Webdesign gesetzt. Erstmals wurde damit Claude Fable 5 vom Spitzenplatz verdrängt. Das quelloffene Modell arbeitet dabei nicht nur zuverlässig, sondern verursacht auch deutlich geringere Kosten als die Konkurrenz.
Anthropic entrohnt
GLM-5.2 ist das neueste Modell des chinesischen KI-Spezialisten Zhipu AI. Im Single-Turn-Webdesign-Benchmark von Design Arena konnte es seine Leistungsfähigkeit nun unter Beweis stellen und das bislang dominierende Claude Fable 5 von Anthropic erstmals vom ersten auf den zweiten Platz verdrängen. Auch die Versionen Claude Opus 4.6 und 4.7 ließ der Neuling hinter sich. Gegenüber dem Vorgänger GLM-5.1 gelang dem Modell ein Sprung um fünf Plätze, wodurch es in der Kategorie „Code Categories“ einen Elo-Wert von rund 1.360 erreichte.
Bemerkenswert ist dabei, dass GLM-5.2 mit 744 Milliarden Parametern dieselbe Größe wie sein Vorgänger besitzt, diese Werte bei der Konkurrenz Schätzungen zufolge dagegen mehr als sechsmal so groß ausfallen sollen. Diese Effizienz spiegelt sich auch bei den Kosten wider: Laut Design Arena werden 1,40 US-Dollar pro eine Million Eingabetoken und 4,40 US-Dollar pro eine Million Ausgabetoken veranschlagt. Claude Fable 5 verlangt für dieselbe Menge dagegen 10 beziehungsweise 50 US-Dollar.
Hohe Zuverlässigkeit und hochwertige Grundlagen
Einer Analyse von Design Arena zufolge basiert der Erfolg von GLM-5.2 vor allem auf seiner hohen technischen Zuverlässigkeit. Zudem soll die Anwendung Bibliotheken wie Chart.js oder Three.js deutlich zuverlässiger einsetzen als viele Konkurrenten. Darüber hinaus verwendet GLM-5.2 laut Analyse in 91 Prozent aller Sitzungen TailwindCSS und greift in mehr als der Hälfte der Fälle auf Font Awesome zurück. Dadurch lassen sich komplexere Designs und aufwendigere Interaktionen erzeugen, andere Modelle nutzen diese Werkzeuge deutlich seltener.
Vor allem die Verwendung besonders hochwertiger Grundvorlagen ermöglicht dem Modell anspruchsvolle und zugleich saubere Layouts, wobei es Gleichzeitig auf Bilder aus externen Quellen zurückgreift. Animationen, Typografie und visuelle Strukturen wirken laut Analyse zudem häufig ausgearbeiteter als bei konkurrierenden Modellen. Zugleich vermeidet GLM-5.2 typische Schwächen früherer KI-Systeme wie übermäßige Farbverläufe oder unausgewogene Layouts.
Open Source als weitere Vorteil
Ein weiterer Vorteil liegt in der Offenheit des Systems. GLM-5.2 wird unter einer MIT-Lizenz veröffentlicht und bietet ein Kontextfenster von einer Million Token. Entwickler können das Modell somit lokal betreiben, anpassen und in eigene Anwendungen integrieren, ohne an proprietäre Dienste gebunden zu sein.
Noch Defizite in anderen Bereichen
Ein uneingeschränkter Überflieger ist GLM-5.2 allerdings nicht. Bei der Spieleentwicklung, Datenvisualisierung und dem 3D-Design konnte Claude Fable 5 seine Spitzenpositionen weiterhin behaupten. Im Bereich der UI-Komponenten erreicht GLM-5.2 zudem lediglich Platz vier. Darüber hinaus weisen viele der generierten Webseiten gewisse Ähnlichkeiten auf, während Claude Fable 5 in diesem Bereich deutlich vielfältiger und abwechslungsreicher arbeitet.
Die komplexeren Designs können sich zudem an anderer Stelle negativ auswirken. GLM-5.2 erzeugt im Durchschnitt rund 25 Prozent mehr Code und benötigt mit etwa 305 Sekunden ungefähr doppelt so lange wie Claude Fable 5. In agentischen Szenarien legt das Modell außerdem mehr Dateien an.
Dominanz großer Modelle wird aufgebrochen
Dennoch dürfte der Erfolg von GLM-5.2 für die Entwicklergemeinschaft einen wichtigen Meilenstein markieren, der Vorsprung geschlossener Spitzenmodelle im Bereich Webdesign beginnt damit sichtbar zu schrumpfen. Die Kombination aus Open-Source-Lizenz, vergleichsweise niedrigen Betriebskosten und hoher Qualität verdeutlicht, wie schnell sich quelloffene Modelle der Leistungsfähigkeit proprietärer Systeme annähern oder diese sogar übertreffen können.