Connect with us

Künstliche Intelligenz

GLM-4.5: Offenes Sprachmodell für schlanke Hardware


Ein neues Sprachmodell aus China ist da: Das jüngst unter der MIT-Lizenz veröffentlichte Modell GLM-4.5 vom Anbieter Z.ai (ehemals Zhipu) funktioniert richtig gut und lässt sich auch in der kleineren Version auf moderater Hardware flott betreiben. Es handelt sich um ein hybrides Modell, das sowohl Reasoning beherrscht – also den Weg zu seinen Schlussfolgerungen zeigt –, aber auch als Non-Reasoning-Modell agieren kann. Interessanterweise geht Qwen, das Sprachmodell von Alibaba, genau den umgekehrten Weg und hat aus den hybriden Modellen wieder zwei unterschiedliche (Instruct, Thinking) gebaut.

GLM-4.5 ist ein großes Modell mit 335 Milliarden Parametern. Die genutzte Mixture-of-Experts-Architektur führt dazu, dass bei der Inferenz immer nur 32 Milliarden Parameter aktiv sind. Die somit kleinere Anzahl von Berechnungen erlaubt eine Beschleunigung in der Generierung der Tokens. Das Modell hat 160 Experten, davon werden jeweils immer acht (und ein Shared Expert, der immer gefragt wird) gleichzeitig verwendet. Es verfügt über 96 Attention-Heads und 92 Transformer-Schichten – und ist damit deutlich tiefer als etwa DeepSeek R1 oder Kimi K2. Obwohl Z.ai die Gewichte auch als FP8-Werte bereitstellt, ist GLM-4.5 trotzdem ein riesiges Modell, das man nicht einfach auf Consumer-GPUs betreiben kann, auch in einer quantisierten Version ist es für die meisten CPUs zu groß.

Deswegen hat Z.ai noch eine kleinere Version des Modells in petto und nennt es GLM-4.5-Air. Es ist in fast allen Belangen dem GLM-4.5-Modell unterlegen, aber nicht drastisch. Dafür ist es mit 106 Milliarden Parametern (12 Milliarden aktiv) viel kleiner und kann zum Beispiel mit 64 GByte RAM auf CPUs in einer Vier-Bit-Quantisierung betrieben werden – oder auch auf einer A100-GPU. Die Architektur ist sehr ähnlich, nur in vielen Dimensionen kleiner (128 Experten, 46 Layer). Leider schweigt sich Z.ai über die genauen Verwandtschaftsverhältnisse von GLM-4.5 und GLM-4.5-Air aus. Auch sonst sind technische Informationen auf dem Blog eher spärlich zu finden.

Relativ genau beschreibt Z.ai den Trainingsprozess und hat dazu die neue Methode „slime“ entwickelt und als Open-Source-Software zur Verfügung gestellt. Das Verfahren legt besonderen Wert auf agentenorientiertes Design, was sich auch in den Ergebnissen widerspiegelt. Dazu nutzt man unterschiedliche Phasen des Reinforcement Learnings, die von Reasoning über agentisches bis zum allgemeinen Training reichen. Z.ai konzentriert sich auf die möglichst flexible Nutzung von Infrastruktur, das Training kann auch asynchron stattfinden und stellt sicher, dass alle GPUs immer optimal genutzt werden.

Benchmarks zu den Modellen gibt es noch wenige, in der LMarena ist es noch nicht zu finden. Die Informationen im Blog-Artikel von Z.ai sehen vielversprechend aus, besonders im Bereich der Agenten-KI scheint es den (viel größeren) State-of-the-Art-Modellen nicht sehr unterlegen zu sein.

Wegen der frei verfügbaren Gewichte kann man das Modell auch selbst ausprobieren. Einen Dialog des Autors mit GLM-4.5-Air finden interessierte Leser hier. Leider nicht ganz so einfach kann man die Funktion testen, mit der GLM-4.5 Folien erstellen kann. Das geht auf der Website von Z.ai selbst und ist beeindruckend.

GLM-4.5 ist ein richtig starkes Modell. Ob es wirklich die entsprechende Wertschätzung erfährt, bleibt abzuwarten. Denn: Aktuell ist es nicht ganz einfach, bei der Flut von neu veröffentlichten Modellen den Überblick zu bewahren. Alleine Qwen hat innerhalb weniger Tage viele Modelle veröffentlicht, darunter Qwen3-Coder-30B-A3B, das mit nur drei Milliarden aktiven Parametern lokal beim Programmieren unterstützen kann. Dabei scheint es eine ausgezeichnete Figur zu machen – die zwar sicher nicht an das nur zehn Tage früher veröffentlichte Qwen3-Coder-480B-A35B-Instruct herankommt, aber das hat auch 16-mal so viele Parameter. Spannend daran ist, dass es sich bei diesen Modellen nicht um Reasoning-Modelle handelt, die aber dennoch in der gleichen Liga spielen, die bisher den reinen Reasoning-Modellen vorbehalten war. Die deutlich schnelleren Antworten (durch viel weniger generierte Tokens wegen des nicht notwendigen Reasonings) führen zu deutlichen Effizienzgewinnen bei der Programmierung.

Aber auch methodisch hat sich in wenigen Tagen viel getan. Der neue „slime“-Trainingsprozess kann als Open-Source-Software auch von anderen Anbietern genutzt werden. Qwen hat das GRPO-Verfahren verfeinert und GSPO genannt. Kimi K2 nutzt zur Optimierung der Gewichte nicht AdamW, sondern Muon und erreicht damit eine schnellere Konvergenz. Fügt man all diese Puzzlestücke zusammen, kann man erwarten, dass sich die Frequenz der neu verfügbaren und besseren Modelle bald sicher noch erhöht.


(fo)



Source link

Weiterlesen
Kommentar schreiben

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Künstliche Intelligenz

heise+ Update vom 1. August 2025: Lesetipps fürs Wochenende


Liebe Leserinnen und Leser,

langsam habe ich genug vom vielen Regen hier in Hannover. Auf der anderen Seite weiß ich ganz genau, dass sich die Zukunfts-Michaela wahrscheinlich auch über die kommende Sommerhitze beschweren wird. Warum ihr also nicht einen Gefallen tun und schon mal vorsorglich Sonnenschutzfolien an die Fenster in der Südlage anbringen? Mein Kollege Alexander Spier hat sich umgehört, wie Sonnenfolien bei Hitze helfen können und was sie tatsächlich taugen. Ich weiß nicht wie es Ihnen geht, aber bei über 30 Grad Außentemperatur greift man doch gern zu jeder Hilfe, um für ein angenehmes Raumklima zu sorgen. 🙂

Apropos Raumklima: Fürs gute Raumklima helfen ja bekanntlich Pflanzen. Allerdings meine ich nicht die Bauklötzchen-Variante von Lego – die stehen im heise-Haupthaus nämlich in einigen Büros als Deko-Element herum. In der Cafeteria stolpert man sogar über die Lego-Nachbildung der Titanic (und ja, ich frage mich bis heute, warum die da überhaupt steht und wer sie dort hingebracht hat). Was ich aber dadurch gelernt habe: Lego ist bei Erwachsenen noch immer super beliebt. Allerdings ist das Hobby ziemlich teuer. Viele Lego-Deko-Sets sind ein kleines Vermögen wert – je größer, desto wilder der Preis. Zum Glück gibt es aber diverse günstigere Alternativen. Und die haben wir uns für einen Artikel angesehen.


Das war die Leseprobe unseres heise-Plus-Artikels „heise+ Update vom 1. August 2025: Lesetipps fürs Wochenende „.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.



Source link

Weiterlesen

Künstliche Intelligenz

Fliegen am Limit: Metas neuer 3D-360-Grad-Film lässt Extrem-Flugsport erleben


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Der etwa einstündige Film begleitet die Wingsuit-Athleten Fred Fugen und Vincent Cotte in die italienischen Dolomiten und dokumentiert zwei waghalsige Stürze in die Tiefe. Besonders spektakulär ist der zweite Sprung, der haarscharf an Felsen vorbei durch einen engen Canyon führt.

Die Flüge wurden aus der Nähe mit einer Drohne gefilmt, die eine schwere 360-Grad-Kamera mit sich trug. Gesteuert wurde das System von einem Drohnenpiloten aus einem Helikopter, der Sichtkontakt zur Drohne halten musste. Bei einem späteren Dreh an einem anderen Ort klappte das nicht und das Fluggerät stürzte mitsamt Kamera in die Tiefe. Die Aufnahme wurde nicht wiederholt.

Der zweite Teil des Films dokumentiert eine Expedition der Paragliding-Athleten Aaron Durogati und Matthias Weger nach Pakistan. Mithilfe thermischer Aufwinde steigen sie auf mehrere tausend Meter Höhe und gleiten entlang der imposanten Bergketten des westlichen Himalajas.


Zwei Paraglider im Tandemflug mit herabhängender Kamera.

Zwei Paraglider im Tandemflug mit herabhängender Kamera.

Trotz einiger Pannen verliefen die Dreharbeiten für alle Beteiligten glimpflich.

(Bild: Jonathan Griffith Productions / Red Bull)

Auch dieser Abschnitt der Dreharbeiten erwies sich als technisch aufwendig und riskant: Der fliegerisch unerfahrene VR-Dokumentarfilmer Jonathan Griffith bediente die Kamera im Tandemflug mit einem Paragliding-Profi. Das 15 Kilogramm schwere 360-Grad-Kamerarig baumelte dabei unterhalb der Fliegenden. Sobald das Team einmal in der Luft war, gab es kein Zurück und keine Möglichkeit, die Aufnahme zu pausieren, erklärt Griffith.

In puncto Bildqualität gehört der 3D-360-Grad-Film nicht zum Besten, was man in diesem Bereich bislang gesehen hat. Was auch an den Motiven liegt: Bei weiten Landschaftspanoramen geraten Auflösung und Tiefenwirkung aktueller VR-Kameras an ihre Grenzen. Für filmbegeisterte Besitzer einer Meta Quest ist Touching the Sky VR dennoch Pflichtprogramm, nicht zuletzt, weil die Aufnahmen in ihrer Art nahezu einzigartig sind.

Dasselbe gilt für die früheren Kollaborationen zwischen Meta und Jonathan Griffith „Everest VR: Journey to the Top of the World“ und „Alex Honnold: The Soloist VR„. Alle drei Filme sind über die VR-App Meta Quest TV verfügbar. Wir empfehlen die Zwischenspeicherung der 360-Grad-Filme für eine etwas bessere Bildqualität.

Ein 30-minütiges 2D-Making-of zeigt die Herausforderungen und Gefahren, mit denen das Filmteam während der Dreharbeiten konfrontiert war.


(tobe)



Source link

Weiterlesen

Künstliche Intelligenz

Developer wollen Liquid Glass testen: Beta von iOS 26 offenbar sehr beliebt


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Durchaus umstritten, aber auch interessant: Apples in iOS 26 und Co. umgebautes Grunddesign stößt bei den registrierten Apple-Developern augenscheinlich auf große Nachfrage, zumindest was ein Ausprobieren betrifft. Wie Konzernchef Tim Cook am Donnerstagabend vor Analysten bei der Bekanntgabe der jüngsten Quartalszahlen mitteilte, wollten sehr viele Entwickler die seit Juni bereitgestellte Developer Beta testen.

Es sei „wunderbar zu sehen“, wie sich „eine großartige Dynamik für unsere Plattformen“ entwickele, so Cook. Seinen Angaben nach ist die iOS-26-Vorabversion „bei weitem die populärste Developer Beta, die wir jemals hatten“. Das gilt demnach auch für iPadOS 26 und macOS 26, die ebenfalls sehr oft heruntergeladen wurden. Spezifische Installationszahlen nannte Cook jedoch nicht, auch zur Public Beta der neuen Betriebssysteme, die erst seit letzter Woche bereitsteht, äußerte sich der CEO nicht.

Es ist aber davon auszugehen, dass auch diese auf großes Interesse stößt, denn die Umgestaltung von iOS und Co. ging seit Jahren nicht mehr so weit. Allerdings sollte man für die Beta am besten ein zusätzliches Gerät bereithalten und nicht mit einem Alltags-iPhone (oder Alltags-iPad) testen. Schließlich enthält die Beta noch Fehler und auch die Veränderungen an UI und Bedienung könnten womöglich erschrecken. Auf dem Mac bietet es sich wiederum an, macOS 26 in einer virtuellen Maschine auszuprobieren. Das geht besonders einfach und kostenlos mit Virtual Buddy.

Zu bedenken ist allerdings, dass Apple erst vor zwei Jahren die Pflicht aufgehoben hatte, zahlender Entwickler zu sein, um Betas herunterzuladen. Zuvor musste man knapp 100 US-Dollar im Jahr an Apple geben. Entsprechend ist es mittlerweile deutlich einfacher, an Entwickler-Betas heranzukommen, was die Zielgruppe sicherlich vergrößert hat. Es reicht, sich mit seinem Apple-Account auf der Developer-Website zu registrieren und Apples Vertragsbedingungen zu akzeptieren.

iOS 26, macOS 26 und die anderen neuen Betriebssysteme erscheinen vermutlich im September. visionOS 26 für die Vision Pro lässt sich derzeit nicht außerhalb der Developer-Beta testen. Das dürfte Apple wohl auch so beibehalten.


(bsc)



Source link

Weiterlesen

Beliebt