Künstliche Intelligenz
Empfangswege gemessen: So kommt die Fußball-WM verzögerungsfrei auf den Schirm
Die Nachbarn jubeln bereits, während der Ball am eigenen Bildschirm noch auf dem Elfmeterpunkt liegt – dieses Phänomen kennen viele Streaming-Nutzer. Anlässlich der gestarteten Fußball-WM haben wir nachgemessen, welche Empfangswege sich für die Spiele am besten eignen und von welchen man besser die Finger lässt. Außer natürlich, es sind keine anderen Fußballfans in Rufnähe.
Weiterlesen nach der Anzeige
Wir haben die Latenzen vom Stadion bis zum heimischen Bildschirm beim linearen Fernsehgucken über Satelliten, Kabel und DVB-T im Vergleich zum Datenstrom aus dem Internet ermittelt. Beim IPTV-Streaming haben wir zudem geprüft, welche Apps sich besonders eigenen und mit welcher Streaming-Hardware der Ball am Bildschirm am schnellsten im Tor landet. Außerdem haben wir während des Eröffnungsspiels am Donnerstag erneut gemessen, dabei aber abgesehen von den WM-Kanälen der Telekom keine wesentlichen Änderungen feststellen können.
Im linearen TV
Weil das Satellitensignal in der Vergangenheit der schnellste Empfangsweg war, haben wir DVB-S2 bei unseren Latenzmessungen als virtuellen Nullpunkt gewählt. Ganz allgemein liegt der Empfang von Kabel-TV im ZDF nahezu gleich auf und in der ARD knapp 1,5 Sekunden dahinter. Eine Ausnahme bildet derzeit Vodafone mit seinem „Jubel-Booster“.

Der Kabelempfang im Vodafone-Netz (ganz links) liegt im ZDF etwa zwei Sekunden vor dem Sat-Empfang (ganz rechts). Der WM-Kanal von Magenta.tv liegt (zweiter großer Schirm links) liegt um knapp 7 Sekunden hinter DVB-S2.
Kabelnetzbetreiber Vodafone liefert das TV-Signal von ARD und ZDF anlässlich der WM beschleunigt aus. Mit dem „Jubel-Booster“ genannten Kniff schiebt sich der Empfang im Kabelnetz von Vodafone vor das Satellitensignal: In unseren neuerlichen Messungen lag das TV-Signal in der ARD jetzt 1,2 Sekunden vor dem Satelliten, im ZDF erschien es 1,8 Sekunden vor dem Sat-Empfang auf dem Bildschirm. Die reduzierten Latenzen gelten aber nur für Das Erste und ZDF im Vodafone-Kabelnetz, und sie werden nach der WM wieder deaktiviert.
Der Jubel-Booster
Vodafone nutzt sein Glasfasernetzwerk, um die Studiosignale von Das Erste und ZDF unkomprimiert bis direkt zu letzten Verteilerstufe zu transportieren. Das sonst übliche Pre-Encoding lässt das Unternehmen dabei ebenso aus wie eine der Transcoding-Stufen und encodiert das Studiosignal erst ganz zum Schluss in einem Low-Delay-Modus ins nötige Kabel-TV-Signal. Durch das Eindampfen der Verarbeitungsprozesse und die eigene Glasfaseranbindung konnte Vodafone rund zwei Sekunden einsparen.
Weiterlesen nach der Anzeige
Das Antennenfernsehen DVB-T2 liegt nur zwei Sekunden hinter dem TV-Empfang per Satellit. Der große Vorteil der für ARD und ZDF kostenlosen HD-Empfangsvariante: Es genügt eine Stummelantenne am großen Smart-TV im Garten oder ein preiswerter DVB-T2-Receiver nebst Antenne am HDMI-Eingang eines Beamers. Ob Sie sich im Empfangsgebiet befinden, können Sie bei Freenet mit dem Empfangscheck für DVB-T2 herausfinden: In Großstädten ist die Chance sehr groß, auf dem platten Land weniger. Die zwei Sekunden Verzögerung gegenüber DVB-S2 kann man gerade aushalten.

Das Antennenfernsehen DVB-T2 wird in großen Ballungsräumen ausgestrahlt, so auch in der Umgebung des heise-Verlags. Auf dem Land benötigt man teilweise eine aktive Antenne – oder hat gar keinen Empfang.
Im Stream
Wer weder einen Anschluss für lineares TV hat, noch im Antennenfernsehen empfangen kann, muss streamen. Hier können erhebliche Verzögerungen entstehen und das ist bei Talkshows, Serien oder Unterhaltungssendungen unerheblich, kann beim Fußballgucken aber richtig nerven.
In unseren Messungen haben sich die Mediatheken-Apps von ARD und ZDF durchweg als die schnellste Möglichkeit herausgestellt; ihr Signal liegt zwei bis sieben Sekunden hinter dem Satelliten-Signal DVB-S2.
Der Einfluss der Empfangshardware ist dabei nicht allzu groß, wir empfehlen aber, halbwegs moderne Geräte mit schnellem Prozessor zu nutzen. So gelangten Streams aus der ARD-Mediathek im Browser am Windows-PC, in der App am Apple TV 4K und mit einem guten Smartphone durchweg schneller auf den Schirm als mit schmaler Hardware wie einem älteren FireTV-Stick. In der ARD waren die Latenzen unabhängig von der verwendeten Hardware meist etwas größer als im ZDF.
Das Gute: ARD und ZDF übertragen im FreeTV sämtliche WM-Spiele der deutschen Fußballnationalmannschaft sowie die Halbfinals und das WM-Finale am 19. Juli und diverse weitere Spiele.
Telekom überträgt alles
Alle 104 Spiele der Fußball-WM sind zudem auf MagentaTV zu sehen, denn die Telekom hat sich die Übertragungsrechte an der WM gesichert. Sie strahlt die Spiele auch in ihren Fußballkanälen aus. Allerdings dauert es geschlagene 15 Sekunden, bis die TV-Signale im vermeintlichen „Live TV“ der aktuellen MagentaTV-Streamingbox auf dem heimischen Schirm landen.
Die Telekom erklärte auf unsere Anfrage, dass per MagentaTV mehr als 1000 Stunden Live-Fußball, Analysen, Talks und Hintergrundberichte in drei WM-Kanälen bereitstehen. Auf der aktuellen MagentaTV-Hardware (Box One und Stick der 2. Generation) laufen alle Spiele in UHD-Qualität mit Dolby Vision und Dolby Atmos. „Dass es beim Streaming im Vergleich zu anderen Technologien zu Zeitverzögerung kommt, lässt sich leider nicht vermeiden. Durch das Zwischenspeichern von Datenpaketen (Buffering) wird sichergestellt, dass das Bild auch bei kurzen Schwankungen im Internet nicht ruckelt“ sagt die Telekom.
Beim Eröffnungsspiel haben in einem WM-Kanal nachgemessen und da lag das Signal tatsächlich knapp acht Sekunden hinter DVB-S2 und landet damit deutlich schneller auf dem Schirm als mit dem vermeintlichen „Live TV“ der Box One. Dennoch scheinen uns knapp acht Sekunden ganz schön lang – vor allem, wenn man bedenkt, wie viel Geld die Telekom für die Übertragungsrechte ausgegeben hat.

Mit der Waipu.tv-Box (oben links) landet das Bild neun Sekunden vor dem LiveTV-Stream in der Waipu-App (unten rechts) auf dem Schirm. Der WM-Kanel der Telekom (oben Mitte) liegt kurz hinter der Waipu.tv-Box, das LiveTV-Signal in der Magenta-App (unten Mitte) ordnet sich zwischen den beiden ein.
Als akzeptable Streaming-Alternative zu den Mediatheken erwies sich in unseren Messungen das „Live-TV“ an der Waipu.tv-Box: Es lag bei ARD und ZDF sechs Sekunden hinter dem Sat-Signal. Der latenzarme Empfang hat bei uns aber nur mit der Box funktioniert und nicht in der Waipu.tv-App etwa am Mobilgerät. Alle anderen TV-Streaminganbieter produzierten in ihrem vermeintlichen Live-TV Verzögerungen zwischen neun und 27 Sekunden – das ist bei Live-Events wie der Fußball-WM inakzeptabel.
Unsere Empfehlung
Insgesamt empfehlen wir deshalb, beim Streamen mit möglichst geringen Latenzen die Mediatheken-Apps von ARD und ZDF zu nutzen. Wer möglichst viele Hintergrundinfos und Analysen sucht, wird mit den Magenta-WM-Kanälen gut bedient. Man braucht dafür aber ein MagentaTV-Abo und muss im Livestream bis zu vier Sekunden mehr Latenz gegenüber den Mediatheken in Kauf nehmen. Im LiveTV an der Waipu.tv-Box waren es akzeptable sechs Sekunden.
Wer lineares Fernsehen empfangen kann, liegt per Kabel, Satellit und DVB-T2 um einige Sekunden vor allen Streamingdiensten und gewinnt als Vodafone-Kabelkunde sogar noch ein bis zwei Sekunden gegenüber dem Sat-Empfang.
Übrigens hängt auch das Sat-Signal gegenüber dem Live-Erlebnis im Stadion hinterher: Es dauert circa sieben Sekunden aus den WM-Stätten in den USA, Kanada und Mexiko, bis es in unseren Wohnzimmern ankommt. Wer diese Zeit nicht abwarten will, muss das Radio einschalten. Aber Achtung: Sie könnten damit schnell zum Stimmungskiller werden …
| Verzögerungen beim TV-Empfang 2026 | |||
| ARD | ZDF | ||
| [Messwerte in Sekunden] | <– besser | <– besser | |
| DVB-Empfang (lineares TV) | |||
| Satellit HD 1 | 0 | 0 | |
| Kabel HD 2 | 1,4 3 | 0,1 4 | |
| DVB-T2 HD | 2 | 2 | |
| MagentaTV Box | |||
| ARD / ZDF Mediathek | 6 | 2.5 | |
| MagentaTV App (Live TV) | 15 | 15 | |
| MagentaTV WM-Kanal | 7 | ||
| Zattoo App | 11 | 12 | |
| Waipu.tv Box | |||
| ARD / ZDF Mediathek | 5 | 2.5 | |
| Waipu.tv App (Live TV) | 6 | 6 | |
| Waipu.tv Stick 4K | |||
| ARD / ZDF Mediathek | 6 | 5.8 | |
| Waipu.tv App | 26 | 23 | |
| Amazon Fire TV Stick | |||
| ARD / ZDF Mediathek | 7 | 5.5 | |
| MagentaTV | 22 | 22 | |
| Waipu.tv App | 23.5 | 22 | |
| Zattoo App | 16 | 16.5 | |
| Joyn App | 31.5 | 27 | |
| Apple TV 4K | |||
| ARD / ZDF Mediathek | 4 | 2.5 | |
| MagentaTV | 28 | 27 | |
| Waipu.tv App | 21 | 22 | |
| Zattoo App | 15 | 12 | |
| Joyn App | 32 | 26 | |
| Windows-PC | |||
| ARD / ZDF im Browser | 2 | 3.5 | |
| ARD / ZDF Mediathek | – | 3.5 | |
| MagentaTV im Browser | 22 | 21 | |
| Waipu.tv App | 12.5 | 14 | |
| Zattoo App | 11 | 9 | |
| Joyn App | 39 | 41 | |
| Android-Mobilgerät | |||
| ARD / ZDF Mediathek | 4 | 4 | |
| MagentaTV | 21.5 | 15 | |
| Waipu.tv App | 24 | 23 | |
| Zattoo App | 9.5 | 10 | |
| Joyn App | 27 | 26 | |
| alle Angaben in Sekunden und bezogen auf Satelliten-Empfang | |||
| 1 Der Empfang per Satellit liegt ca. 7 Sekunden hinter der Echtzeit im Stadion | |||
| 2 gemessen im Kabelnetz von Vodafone (ehem. Kabel Deutschland) ohne Booster | |||
| 3 mit WM-Booster 1,2 s vor Sat | |||
| 4 mit WM-Booster 1,8 s vor Sat | |||
(uk)
Künstliche Intelligenz
Ex-Krypto-König Bankman-Fried scheitert mit Berufungsantrag
Der ehemalige Digitalgeld-Unternehmer Sam Bankman-Fried ist mit einem Einspruch gegen seine Verurteilung als Betrüger im ersten Anlauf gescheitert. Drei Richter eines Berufungsgerichts lehnten es ab, das Urteil zu kippen, das zu einer Haftstrafe von 25 Jahren führte. Der 34-jährige Bankman-Fried kann noch eine Prüfung durch das gesamte Gericht beantragen oder vor das Oberste Gericht der USA ziehen.
Weiterlesen nach der Anzeige
FTX, einer der größten Handelsplätze für Kryptogeld wie Bitcoin, war Ende 2022 spektakulär zusammengebrochen. Bankman-Fried wurde auf den Bahamas festgenommen und an die USA ausgeliefert. Er wurde 2024 verurteilt. Derzeit läuft ein Berufungsverfahren.
Milliarden-Loch oder Liquiditätskrise?
Während das Geschäft mit Kryptowährungen kompliziert sein kann, wurde Bankman-Fried am Ende klassischer Betrug zur Last gelegt: Veruntreuung von Kundenvermögen. Bankman-Fried stand auch hinter einem Hedgefonds namens Alameda Research, der riskante Geschäfte machte und sich Mittel bei FTX lieh.
Eigentlich hätten dabei Sicherheiten hinterlegt werden müssen. Es gab auch Computersysteme, die dafür sorgen sollten. Doch diese Software machte eine heimliche Ausnahme für Alameda. Dadurch konnte der Hedgefonds bei FTX so tief ins Minus gehen, wie er wollte. Als Alameda-Geschäfte schiefgingen, klaffte in der FTX-Kasse der Anklage zufolge ein Milliarden-Loch. Bankman-Fried behauptet dagegen, FTX habe zwar in einer Liquiditätskrise gesteckt, sei aber grundsätzlich zahlungsfähig gewesen.
Diese Position war auch die Basis für Bankman-Frieds Berufung. Der Richter hatte in dem Verfahren an einem Bezirksgericht den Anwälten verboten, den Geschworenen zu sagen, dass FTX trotz Insolvenz in der Lage gewesen sei, Anlegern das Geld zurückzuzahlen. Das sei ein Fehler gewesen, hieß es in dem Berufungsantrag. Die Richter am Berufungsgericht befanden in ihrer Entscheidung aber, dies sei irrelevant, da der Betrug bereits bei der Überweisung an Alameda passiert sei.
Begnadigung erst nach Haftstrafe?
Weiterlesen nach der Anzeige
Bankman-Fried ersuchte auch bereits um eine Begnadigung. Allerdings geht aus den Informationen im System des US-Justizministeriums hervor, dass der 34-Jährige zumindest derzeit erst nach Ablauf seiner 25 Jahre langen Haftstrafe begnadigt werden will. Nach US-Recht kann man dadurch etwa das Wahlrecht wiedererlangen. US-Präsident Donald Trump hatte Anfang des Jahres in einem Interview der „New York Times“ gesagt, er habe nicht vor, Bankman-Fried zu begnadigen.
Lesen Sie auch
(nen)
Künstliche Intelligenz
KI-Bearbeitung bei Apple und Warnlicht für Brillen – Fotonews der Woche 24/2026
Die WWDC 2026 brachte für Fotografen durchaus Interessantes: Apple stattet seine Fotos-App mit drei neuen KI-gestützten Bearbeitungswerkzeugen aus. Mit Details zu den konkreten Funktionen hält sich das Unternehmen zwar noch bedeckt, aber die Integration in OS 27 und „Apple Intelligence“ verspricht zumindest, dass die Bearbeitung direkt auf dem Gerät stattfindet – ein Pluspunkt für Datenschutz-Bewusste. Ob die Tools allerdings mehr können als die bereits etablierten KI-Funktionen der Konkurrenz, wird sich erst im Herbst zeigen, wenn OS 27 ausgerollt wird.
Weiterlesen nach der Anzeige
(Bild: heise )
Meta wischt heimlich Beweise weg
Deutlich brisanter ist, was bei Meta passiert: Nachdem das Unternehmen vehement bestritten hat, Gesichtserkennungstechnologie in seine Ray-Ban Smart Glasses zu integrieren, entdeckten Entwickler einen entsprechenden Code in der App. Kurz darauf verschwand dieser Code jedoch still und leise, ohne offizielle Erklärung. Das riecht nicht nur nach schlechtem Gewissen, sondern wirft auch die Frage auf, was Meta eigentlich mit den Aufnahmen seiner Brillenträger vorhat.
Die ganze Aktion erinnert an einen Einbrecher, der beim Verlassen des Tatorts noch schnell die Fingerabdrücke wegwischt. Nur, dass hier Millionen von Nutzern potenziell betroffen sind. Meta behauptet weiterhin, keine Gesichtserkennung zu nutzen – aber warum dann der Code? Und warum die heimliche Löschung? Vertrauen aufzubauen geht definitiv anders.
c’t Fotografie Zoom In abonnieren
Ihr Newsletter mit exklusiven Foto-Tipps, spannenden News, Profi-Einblicken und Inspirationen – jeden Samstag neu.
E-Mail-Adresse
Ausführliche Informationen zum Versandverfahren und zu Ihren Widerrufsmöglichkeiten erhalten Sie in unserer Datenschutzerklärung.
Gesetzgeber fordern sichtbare Warnleuchten
Apropos Vertrauen: In den USA haben Abgeordnete einen Gesetzentwurf eingebracht, der Smart Glasses mit Aufnahmefunktion zu einer deutlich sichtbaren Warnleuchte verpflichten würde. Der „Smart Glasses Recording Act“ soll verhindern, dass Menschen heimlich gefilmt werden – ein Problem, das mit der zunehmenden Verbreitung von Kamerabrillen immer drängender wird.
Weiterlesen nach der Anzeige
Die vorgeschlagene Regelung ist eigentlich selbstverständlich: Wer aufnimmt, muss das kenntlich machen. Genau wie bei Metas aktuellen Ray-Ban-Modellen, die bereits eine kleine LED haben – die allerdings so dezent ist, dass man sie leicht übersehen kann. Der Gesetzentwurf würde Standards setzen, wie hell und wie groß diese Anzeige sein muss. Dass so etwas überhaupt gesetzlich geregelt werden muss, zeigt, wie wenig die Hersteller von sich aus an Privatsphäre denken.
Die Zukunft der tragbaren Kameras
Smart Glasses stehen an einem Scheideweg: Entweder die Hersteller nehmen Datenschutz ernst und bauen wirklich transparente Geräte, oder die Gesetzgeber werden es ihnen aufzwingen. Letzteres scheint gerade wahrscheinlicher. Die Technologie selbst ist faszinierend – eine Kamera, die sieht, was man sieht, ohne dass man ein Smartphone zücken muss. Aber dieser Komfort darf nicht auf Kosten der Privatsphäre anderer gehen.
Interessant ist auch die Parallele zu den frühen Tagen der Smartphone-Fotografie: Damals gab es ähnliche Bedenken, heute ist es normal, dass Handys überall Fotos machen können. Der Unterschied? Bei Smartphones ist es hingegen offensichtlich, wenn jemand fotografiert, bei einer Brille eben nicht.
Zurück zu Apple: Die neuen KI-Tools in der Fotos-App sind Teil einer größeren Strategie. Mit „Apple Intelligence“ positioniert sich das Unternehmen als datenschutzfreundliche Alternative zu Google und Meta. Ob das mehr als Marketing ist, wird die Praxis zeigen. Immerhin: On-Device-Verarbeitung ist ein echter Vorteil gegenüber Cloud-basierten Lösungen.
Die drei neuen Bearbeitungswerkzeuge reihen sich ein in einen Trend, der die Fotografie gerade grundlegend verändert: KI wird vom Gimmick zum Standard-Feature. Ob das gut oder schlecht ist, hängt davon ab, wie transparent die Hersteller damit umgehen – und wie viel Kontrolle sie den Nutzern noch lassen.
English Heritage und der Foto-Fauxpas
Während in den USA über Hightech-Regulierung diskutiert wird, zeigt ein Vorfall aus England, dass auch analoge Foto-Regeln ganz gehörig danebengehen können. English Heritage, die Organisation, die in England historische Stätten verwaltet, hat sich eine kleine PR-Panne geleistet: Ein Hobbyfotograf wollte im Carlisle Castle ein paar Aufnahmen machen – vermutlich die üblichen Touristenfotos mit etwas mehr Ambition. Doch statt eines freundlichen „Viel Spaß beim Knipsen“ wurde er darauf hingewiesen, dass er eine kommerzielle Genehmigung benötige. Kostenpunkt: hundert Pfund.
Was war passiert? Offenbar hatte das Personal vor Ort die internen Regelungen etwas zu eifrig interpretiert. English Heritage hat durchaus nachvollziehbare Regeln für kommerzielle Film- und Fotoproduktionen. Wenn ein Team mit Beleuchtung, Assistenten und Catering anrückt, um einen Werbespot zu drehen, dann soll dafür natürlich gezahlt werden. Aber ein einzelner Fotograf mit seiner Kamera? Der fällt definitiv nicht in diese Kategorie.
Nach Beschwerden ruderte English Heritage schnell zurück. Man gab den Fehler zu und stellte klar: Hobbyfotografen sind willkommen, solange sie nicht den Betrieb stören oder kommerzielle Shootings durchführen. Die überarbeiteten Richtlinien auf der Website betonen nun deutlicher, dass zwischen privatem Fotografieren und professionellen Produktionen unterschieden wird.
Der schmale Grat zwischen Hobby und Kommerz
Interessant wird es natürlich bei der Frage: Was ist eigentlich „kommerziell“? Wenn jemand seine Urlaubsfotos auf Instagram postet und damit theoretisch Geld verdienen könnte – zählt das schon? Oder erst, wenn ein Auftrag dahintersteht? English Heritage definiert kommerzielle Nutzung als geplante, professionelle Produktionen, bei denen das Foto oder Video später verkauft oder für Werbezwecke verwendet wird. Ein Influencer mit Stativ in jeder Ecke könnte also in eine Grauzone geraten.
Die Organisation betont allerdings, dass man pragmatisch bleiben wolle. Niemand soll seinen Personalausweis vorzeigen oder eine eidesstattliche Erklärung abgeben müssen, dass die Bilder nur für die private Fotosammlung bestimmt sind. Solange keine Requisiten aufgebaut, keine Models instruiert und keine Drohnen gestartet werden, dürfte man auf der sicheren Seite sein.
Der Vorfall zeigt exemplarisch, wie schnell gut gemeinte Regelungen in Überregulierung umschlagen können. Viele Museen, Schlösser und historische Stätten weltweit kämpfen mit ähnlichen Abgrenzungsproblemen. Einerseits wollen sie ihre Locations vor Kommerzialisierung schützen und an professionellen Nutzungen mitverdienen. Andererseits sind Besucher mit Kameras heute die Norm und oft die beste kostenlose Werbung. Immerhin: English Heritage hat schnell reagiert und transparent kommuniziert – in Zeiten, in denen Social Media jeden Fauxpas binnen Stunden zum viralen Desaster machen kann, ist das recht bemerkenswert.
Empfehlung zum Wochenende
Wer sich für die rechtlichen und ethischen Fragen rund um Kamera-Technologie interessiert, sollte die Entwicklung des „Smart Glasses Recording Act“ verfolgen. Auch wenn er zunächst nur in den USA diskutiert wird, könnten ähnliche Regelungen bald auch in Europa kommen. Die DSGVO lässt grüßen – und die ist bei heimlichen Aufnahmen noch viel strenger als amerikanische Gesetze.
Und für alle, die demnächst historische Stätten in England besuchen wollen: Keine Sorge, die Kamera darf mit. Solange Sie nicht mit Lichtanlage, Maskenbildner und Regieassistent anrücken, wird niemand nach Ihrer Gewerbeanmeldung fragen. Sollte doch einmal jemand übereifrig sein, hilft vermutlich ein freundlicher Hinweis auf den jüngsten Vorfall.
Die Themen der Woche zeigen zwei Seiten derselben Medaille: Auf der einen Seite drängen neue Technologien wie Smart Glasses und KI-Bildbearbeitung in einem Tempo nach vorn, dem Gesetzgeber kaum hinterherkommen. Auf der anderen Seite verheddern sich altehrwürdige Institutionen in Regelwerken, die mit der Fotorealität von heute nichts mehr zu tun haben. Die Frage ist nicht mehr, ob wir Kameras überall haben werden, sondern wie wir damit umgehen. Die Industrie braucht klare Grenzen – und die Verwaltung ein bisschen mehr gesunden Menschenverstand. Beides wäre schon viel wert.
Lesen Sie auch
(tho)
Künstliche Intelligenz
Model-Schau: Reasoning aus China, kleine Liquid-Modelle und neue Microsoft-Welt
Zum Start in den Sommer geht es auch bei den Sprachmodellen heiß zu. Neue chinesische Modelle von StepFun und MiniMax versprechen günstiges Reasoning und sind auf agentische Workflows optimiert. Die Liquid Foundation Models sind aufgrund ihrer speziellen Architektur sehr kompakt und trotzdem leistungsfähig.
Weiterlesen nach der Anzeige

Prof. Dr. Christian Winkler beschäftigt sich speziell mit der automatisierten Analyse natürlichsprachiger Texte (NLP). Als Professor an der TH Nürnberg konzentriert er sich bei seiner Forschung auf die Optimierung der User Experience.
Nvidia befindet sich weiter im Höhenflug und hat einige neue Modelle im Portfolio, allerdings das größte davon lediglich als Ankündigung. Schließlich stellte Microsoft Anfang Juni auf der Build-Konferenz eine ganze Reihe (leider geschlossener) Modelle vor und emanzipiert sich damit weiter von OpenAI.
(Bild: popba / stock.adobe.com)

Die Online-Konferenz Product Owner AI Day 2026 zeigt Produktverantwortlichen am 9. Juli, wie sie Abläufe mit KI automatisieren und sie in Workflows integrieren. Der an zwei Terminen ausgebuchte Workshop findet am 16. Juli ein weiteres Mal statt. Tickets für Konferenz und Workshop sind im Ticketshop verfügbar.
Reasoning-Modell Step 3.7 Flash
Das in Shanghai sitzende KI-Unternehmen StepFun hat nach dem bereits erfolgreichen Modell 3.5 aus dem Frühjahr nachgelegt und ein neues Reasoning-Modell veröffentlicht. Es handelt sich wieder um ein Flash-Modell mit einer ähnlichen Architektur wie das vorherige Modell, das sich allerdings in einigen entscheidenden Punkten verbessert hat. So hat StepFun etwa einen Vision Encoder hinzugefügt, sodass Step 3.7 Flash auch Bilder verstehen kann. Das Reasoning lässt sich nun konfigurieren, damit sich für einfache Fragestellungen nicht sofort sehr viele Token ansammeln. Das ist insbesondere für agentische Nutzung sehr hilfreich.
Wie viele chinesische Modelle war Step 3.5 Flash stark zensiert. Das ist bei Version 3.7 nicht viel anders, aber interessanterweise gibt das Modell die Fakten im Reasoning-Bereich bereitwillig aus, um dann bei der endgültigen Antwort gebremst zu werden. Sicherlich spielen da die Guardrails eine entscheidende Rolle, die dem Modell im letzten Schritt antrainiert werden. Abgesehen davon sind die Antworten größtenteils korrekt. Besonders interessant ist, dass das Reasoning bei deutschen Fragen größtenteils auf Deutsch stattfindet, nur die Unterbrechungen wie „wait“ sind auf Englisch. Das ist bei fast allen anderen Modellen anders, die nur auf Englisch argumentieren.
Ob das Modell wirklich viel besser ist als der Vorgänger, lässt sich schwer entscheiden. In der Community wurde es jedenfalls gelobt, insbesondere im Zusammenspiel mit Coding Agents. Auf der Website von StepFun kann man deutlich bessere Zahlen ablesen als für das ältere Modell, oft übertrumpft es dabei auch DeepSeek V4 Flash. Langfristig wird man auf der LM Arena sehen, wie sich das Modell im wirklichen Leben behauptet.
Weiterlesen nach der Anzeige
Die Ergebnisse von Step 3.7 Flash finden sich im GitHub-Repository zu diesem Artikel.
Performance-Zuwachs mit MiniMax M3
Obwohl MiniMax sein M3-Modell als „Open Weight“ bezeichnet, kann man die Gewichte noch nicht bei Hugging Face herunterladen. Das ändert sich aber hoffentlich bald. Ausprobieren lässt sich das Modell entweder direkt bei MiniMax.ai oder bei OpenRouter. Wie von MiniMax gewohnt, sind die Ergebnisse ausgewogener und weniger zensiert als die anderer chinesischer Modelle.
MiniMax hat wie viele Anbieter die Attention-Architektur optimiert, ging dabei aber einen eigenen Weg. Die Attention wird in zwei Phasen ausgerechnet: Die erste Phase entscheidet, welche Token wichtig sind und gibt diese dann in der zweiten Phase für die volle Attention-Berechnung weiter. MiniMax behauptet, dass das M3-Modell damit Prompts fast zehnmal schneller auswerten kann als MiniMax M2 und bei der Generierung sogar um den Faktor 15 schneller ist. Das wäre ein gewaltiger Fortschritt. Ob es sich bewahrheitet, wird sich zeigen, wenn sich die Modelle lokal betreiben lassen.
Öffentlich verfügbare Benchmarks gibt es noch nicht, aber die Daten von MiniMax selbst sind vielversprechend. Gerade im Bereich Coding kann es mit den besten Modellen von Anthropic wohl mithalten, wenn die Daten korrekt sind.
Die Ergebnisse von MiniMax M3 finden sich im GitHub-Repository zu diesem Artikel.
Schlanke Liquid Foundation Models
Einen ganz anderen Weg geht liquid.ai, das eine andere Architektur für seine Liquid Foundation Models nutzt. Damit lassen sich Token äußerst effizient erzeugen, und diese Modelle funktionieren auch auf CPUs gut. In der Zwischenzeit gibt es eine einige solcher Modelle, neu reiht sich darin LFM2.5-8B-A1B ein, das nur eine Milliarde aktive Parameter hat. Damit will es mit weit größeren Modellen wie gpt-oss-20b, Qwen3-30B-A3B-Thinking-2507 und Gemma-4-26B-A4B-IT konkurrieren. Abgesehen von Gemma sind die zum Vergleich herangezogenen Modelle jedoch etwas älter.
LFM2.5-8B-A1B ist extrem schnell: Auf einem Mac Studio M2 Ultra hat es fast 200 Token pro Sekunde erreicht. Die Ergebnisse können nicht ganz mit den großen Modellen mithalten, aber für Spezialanwendungen oder agentische Szenarien könnte sich das Modell eignen.
Die Ergebnisse von LFM2.5-8B-A1B finden sich im GitHub-Repository zu diesem Artikel.
Bildanalyse und mehr von Nvidia
Nvidia befindet sich nach wie vor im Höhenflug und zeigt das inzwischen auch in seinen Modellen. Populär ist unter anderem LocateAnything, mit dem man Bilder analysieren kann. Als Ergebnis erhält man Boxen, in denen sich bestimmte Objekte befinden. Die Verarbeitung funktioniert hochparallel über alle identifizierten Boxen hinweg, das Modell kann sogar gescannte Dokumente analysieren und findet dort entsprechende Boxen mit Content. Nützlich ist das unter anderem, um GUI-Elemente zu identifizieren und per Agenten einen Browser zu bedienen. Da das Modell mit knapp acht GByte relativ klein ist, sollte es sich auch auf Consumer-GPUs ausführen lassen.
Deutlich mehr Speicher braucht der Pixel Diffusion Decoder, der ein neuartiges Diffusionsmodell im Pixelraum einführt. Die Bedienung ist aktuell noch sehr umständlich: Man muss verschiedene Checkpoints von der Hugging-Face-Seite herunterladen und mit einem speziell bereitgestellten Programm verarbeiten. Ob und wie viel besser Nvidia damit im Vergleich zu herkömmlichen Diffusionsmodellen Bilder generieren kann, muss sich zeigen.
Die Nemotron-Modelle waren bereits bisher schon leistungsfähig. Allerdings hat das Nano-Modell schon über 30 Milliarden Parameter, von denen drei Milliarden aktiv sind. Das vor etwa drei Monaten erschienene Super-Modell nutzt sogar 120 Milliarden Parameter, von denen zwölf Milliarden aktiv sind. Neu verfügbar ist nun das Ultra-Modell mit 550 Milliarden Parametern, von denen „nur“ 55 Milliarden aktiv sind. Nvidia behauptet, damit eine deutlich schnellere Inferenz zu erreichen, was möglicherweise an dem im Modell verwendeten Datentyp NVFP4 liegt.
Auch der optimierte Attention-Mechanismus mit vielen Mamba-Layern trägt dazu bei, der eine Kontextlänge von bis zu einer Million Token ermöglicht. In der Performance kommt Nemotron 3 Ultra nicht ganz an die offenen chinesischen Modelle heran, aber die endgültige Version gibt es erst seit Kurzem. Wie bei allen Nemotron-Modellen stellt Nvidia einen Großteil der Trainingsdaten, den Trainingscode und weitere Inhalte bereit. Damit handelt es sich bei diesen Modellen um die bei weitem offensten – im Sinne von transparent. Lediglich die nicht von Nvidia stammenden, viel kleineren Olmo- oder Apertus-Modelle sind ähnlich offen.
Man merkt dem Modell seine westliche (US-amerikanische) Herkunft in den Antworten deutlich an. Dort, wo chinesische Modelle sich vornehm zurückhalten, gibt das Modell häufig sehr viel klarere, politisch neutralere oder zumindest anders gefärbte Meinungen wieder.
Die Ergebnisse von Nemotron 3 Ultra finden sich im GitHub-Repository zu diesem Artikel.
-
Künstliche Intelligenzvor 3 MonateniPhone Fold Leak: Apple spart sich wohl iPad‑Multitasking
-
Künstliche Intelligenzvor 3 Monaten
JBL Bar 1300MK2 im Test: Soundbar mit Dolby Atmos, starkem Bass und Akku‑Rears
-
Künstliche Intelligenzvor 3 MonatenOscars 2026: Was die heise‑Leser anders entschieden hätten
-
Künstliche Intelligenzvor 3 MonatenEmpfehlungsalgorithmen bei TikTok erklärt: Die Maschine hinter dem Endlos‑Feed
-
Social Mediavor 3 MonatenVon Kennzeichnung bis Plattformpflichten: Was die EU-Regeln für Influencer Marketing bedeuten – Katy Link im AllSocial Interview
-
Künstliche Intelligenzvor 2 MonatenWeitere Entlassungswelle bei Disney: Bis zu 1000 Mitarbeiter betroffen
-
Künstliche Intelligenzvor 2 Monaten„Don’t Starve Elsewhere“: Survival‑Hit kehrt nach zehn Jahren zurück
-
Künstliche Intelligenzvor 2 MonateniX-Workshop Angriffsziel lokales AD − Schwachstellen finden und beheben
