Künstliche Intelligenz
Google I/O: Ankündigung von Modellen Gemini Flash 3.5 und Gemini Omni Flash
Google hat bei seiner Entwicklerkonferenz Google I/O 2026 unter anderem zwei neue KI-Modelle angekündigt: Gemini Flash 3.5 und Gemini Omni. Gemini Flash 3.5 ist eine Weiterentwicklung der Flash-Modellserie. Gemini Omni hingegen ist eine neue generative Modellreihe in der Gemini-Familie, die sich am Anfang vor allem auf die Generierung von möglichst realistischen Videos konzentrieren wird. Später soll Omni „alles aus allem“ generieren können, sagen die Google-Entwickler.
Weiterlesen nach der Anzeige
Gemini Flash 3.5 – noch leistungsfähiger
Gemini Flash 3.5, das Nachfolgemodell von Gemini Flash 3.0, solle in fast allen Bereichen noch leistungsfähiger sein als Gemini 3.1 Pro, teilte Google mit. Besonders bei der Geschwindigkeit, auf die bei den Flash-Modellen besonders Wert gelegt wird, schneidet es wohl sehr gut ab: Laut eigener Aussage soll das neue Flash-Modell viermal mehr Token pro Sekunde ausgeben als andere Spitzenmodelle.
(Bild: Alphabet)
Google preist bei seiner Veröffentlichung, dass Gemini Flash 3.5 sich besonders gut für den gleichzeitigen Einsatz mehrerer Agenten und die Ausführung von längeren Aufgaben eigne. Dank Verbesserungen bei der Programmierung und der Nutzung von Tools sei Gemini 3.5 Flash in der Lage, mehrstündige autonome Sitzungen durchzuführen.
Gemini Flash 3.5 wird das neue Standardmodell für die Gemini App und den AI Mode in Search. Auch die Agenten-Plattformen Google Antigravity, Gemini API, Google AI Studio und Android Studio sollen auf das neue Modell aufbauen, ebenso wie die Unternehmensanwendungen in Gemini Enterprise Agent Platform und Gemini Enterprise. Ein 3.5-Pendant aus der Gemini-Pro-Modellreihe ist laut Google bereits in Arbeit.
Gemini Omni Flash
Ein weiteres KI-Modell, das bei der Google I/O vorgestellt wurde, ist Gemini Omni Flash, das erste Modell einer neuen Gemini-Linie. Die KI soll bald „alles aus allem“ generieren können; ab heute sind Videos als Output möglich, Audio und Bild sollen bald hinzukommen. Beim Input soll in Zukunft auch jede Form möglich sein.
Weiterlesen nach der Anzeige
Im Gegensatz zu Veo, Googles bisherigem Videogenerator, soll Omni umfangreich mit dem Wissen der Gemini-Modelle gekoppelt sein. Dadurch soll es ein tiefergehendes Verständnis dafür haben, was im Video als nächstes geschehen sollte. Nicht nur physikalische Gesetze sollen berücksichtigt werden, wie es bei Veo schon der Fall ist, sondern auch zum Beispiel Geschichtswissen oder kulturelle Hintergründe.
Darüber hinaus soll Gemini Omni mit gesprochener Sprache bedienbar sein und, für Videos besonders wichtig, jeder Prompt soll auf die vorherigen aufbauen. Charaktere und Szenen sollen so möglichst konsistent bleiben, statt sich bei jeder Generierung leicht zu verändern. Omni soll auch in der Lage sein, reale Videoaufnahmen zu verändern – zum Beispiel, indem es Figuren hinzufügt oder bestehende anders handeln lässt. Auch Teil von Omni ist ein Avatar-Feature, mit dem man eine digitale Version von sich erstellen kann, die so klingt und spricht wie man selbst.
Google betont, dass es auch im Rahmen von Omni weiterhin an seinen Transparenzwerkzeugen zur Identifizierung von KI-generierten Inhalten arbeitet: In jedes Video, das mit dem neuen Modell generiert wurde, soll das Google Wasserzeichen SynthID integriert sein. So kann es mit diversen Google-Apps als AI-Video identifiziert werden.
Erstmal hauptsächlich für Bezahl-Abonnenten – und YouTube-Nutzer
Gemini Omni Flash soll zunächst für Plus, Pro und Ultra-Nutzer in der Gemini App und in Google Flow verfügbar sein. Nutzer ohne ein Abo sollen aber bereits jetzt über YouTube Shorts und die YouTube Create App darauf zugreifen können.
Das Nachfolgemodell Gemini Omni Pro ist wohl schon in der Entwicklung.
(rie)