Apps & Mobile Entwicklung

Gemini Omni und Gemini Flash 3.5: Googles neue Spitzenmodelle für Agenten und das Weltverständnis


Gemini Omni und Gemini Flash 3.5: Googles neue Spitzenmodelle für Agenten und das Weltverständnis

Bild: Google

Nachdem Anthropic und OpenAI zuletzt vorgelegt haben, hat Google auf der Entwicklerkonferenz I/O 2026 ebenfalls neue Spitzenmodelle präsentiert. Gemini 3.5 Flash ist das neue Alltagsmodell, das vor allem Agenten antreiben soll. Gemini Omni ist das neue Video-Modell, das Fähigkeiten von Veo und Nano Banana vereint.

Gemini 3.5 Flash: Effizienz und Geschwindigkeit im Fokus

Gemini 3.5 Flash ist der Auftakt für die nächste Generation, die besonders für agentische Aufgaben optimiert ist und besonders effizient laufen soll. In den von Google veröffentlichten Benchmarks kann sich Gemini 3.5 Flash deutlich von den Vorgängern wie Gemini 3.1 Pro absetzen. Es bewegt sich auf einem ähnlichen Niveau wie Anthropics Claude Opus 4.7 und OpenAIs GPT-5.5.

Was Google im Vergleich zu den anderen Modellen in den Vordergrund rückt, ist die Geschwindigkeit und die Effizienz. So ist 3.5 Flash nicht mehr ganz so schnell wie 3.1 Flash, produziert aber noch wesentlich mehr Token pro Sekunde als andere Top-Modelle.

Grundlage für Googles neue Agenten-Armada

Damit ist es laut Google besonders für agentische Aufgaben geeignet, die lange Zeitspannen in Anspruch nehmen. Davon soll auch Googles Coding-Assistent Antigravity profitieren. Bislang spielt dieser im Vergleich zu Claude Code und Codex nur eine untergeordnete Rolle.

Agenten werden bei Google künftig ohnehin eine größere Rolle spielen. In der Suche können Nutzer künftig Subagents aktivieren, um bestimmte Suchanfragen dauerhaft laufen zu lassen. Mit Spark stellte man zudem die Beta-Version eines neuen persönlichen Agenten vor, der autonom im Hintergrund Alltagsaufgaben erledigen soll.

Verfügbarkeit von Gemini 3.5 Flash

Verfügbar ist Gemini 3.5 Flash ab heute über die Gemini-App und den KI-Modus in der Suche. Über Googles Coding-Assistenten Antigravity und die Google Cloud ist es ebenfalls abrufbar.

Gemini Omini als multimodales Weltmodell

Mit Gemini Omni hat Google zudem ein neues Multimodal-Modell vorgestellt, das verschiedene Input-Arten verarbeiten kann, um Inhalte zu generieren. So ist es etwa möglich, bei der Prompt-Eingabe Bilder, Texte, Videos und Audio-Passagen zu kombinieren. Zunächst es auf die Video-Ausgabe beschränkt.

Laut Google-DeepMind-Chef Demis Hassabis ist vor allem das Weltwissen der nennenswerte Fortschritt bei Omni. Es kombiniert die Fähigkeiten von dem Gemini-Modell mit Veo und Nano Banana. Damit soll es in der Lage sein, etwa physikalische Zusammenhänge und Aspekte wie Gravitation, kinetische Energie und Strömungsverhalten deutlich besser zu imitieren. So können Nutzer am Ende deutlich realistischere Inhalte erstellen.

Gemini Omni ist ebenfalls als erstes in einer Flash-Version verfügbar. Ab heute können es Nutzer mit den Abo-Paketen Google AI Plus, Pro und Ultra weltweit nutzen. Das geht sowohl über die Gemini-App als auch über Google Flow.



Source link

Beliebt

Die mobile Version verlassen