Apps & Mobile Entwicklung
Veo 3.1 und Flow: Googles KI-Videogenerator legt bei Realismus und Audio nach
Google hat das eigene KI-Modell für die Videogenerierung überarbeitet und will mit Veo 3.1 vor allem den Realismus erstellter Szenen weiter nach oben schrauben und Anwender auch im Bereich Audio besser unterstützen. Passend dazu gibt es in Googles KI-Video-Tool Flow neue Optionen für das Erstellen und Bearbeiten von Szenen.
Laut Google soll Veo 3.1 im Vergleich zu Veo 3 insgesamt besseres Audio passend zum Video generieren, dem Anwender mehr erzählerische Kontrolle geben und mit gesteigertem Realismus für lebensechte Texturen sorgen. Veo 3.1 baut auf Veo 3 auf, erklärt Google, es folge aber mehr dem Prompt des Nutzers und liefere eine bessere audiovisuelle Qualität, wenn aus einem einzelnen Bild ein Video generiert wird.
Mit dem Update erweitert Google die Audio-Fähigkeiten von Veo auf bereits zuvor existierende Features des Videogenerators, sodass sich jetzt auch dafür Ton erstellen lässt. Mit der Funktion „Ingredients to Video“ können Anwender das KI-Modell mit Referenzfotos füttern, um Charaktere, Objekte und Stil einer Szene zu steuern.
Audio gibt es jetzt auch innerhalb von „Frames to Video“, das Anwender nutzen können, um mittels Start- und Endframe den Inhalt dazwischen mit Übergang zu generieren.
Veo 3.1 bietet mit „Extend“ auch eine Option, um bestehende Inhalte zu erweitern. Das KI-Modell erweitert daraufhin die bestehende Szene auf Basis des Inhalts aus der letzten Sekunde des Originals. Auch für diesen Modus lässt sich jetzt Ton generieren.
Darüber hinaus führt Veo respektive Flow mit dem jüngsten Update auch vollständig neue Funktionen ein. Mit „Insert“ lassen sich in Flow jetzt praktisch beliebige Elemente oder Eigenschaften einer Szene hinzufügen oder für diese definieren. Google gibt als Beispiele besondere Details, phantastische Kreaturen, Schatten oder Beleuchtung an. Ferner stellt Google in Aussicht, dass Anwender schon „bald“ die Option erhalten werden, Objekte und Personen aus Szenen entfernen zu können. Veo respektive Flow soll den Hintergrund und die Umgebung entsprechend wieder auffüllen, so als wäre das Objekt nie vorhanden gewesen.
Veo 3.1 lässt sich mit einem Abo für „Google AI Pro“ ab sofort in Flow nutzen, außerdem steht das neue KI-Modell über die Gemini API für Entwickler und über Vertex AI für Unternehmen zur Auswahl. Auch die Gemini-App greift bereits auf Veo 3.1 zurück.