Künstliche Intelligenz
„Nano Banana“: Google erweitert seine Bildberarbeitungsfunktion in Gemini
Nachdem vor einigen Tagen ein mysteriöser KI-Bildgenerator namens „Nano Banana“ viral ging und Spekulationen aufkamen, Google könnte dahinterstecken, hat das Unternehmen nun die Gerüchte bestätigt. Google stattet seine KI-Anwendung Gemini mit einem neuen, leistungsfähigeren Bildbearbeitungsmodell seiner Forschungstochter DeepMind aus, das den offiziellen Namen Gemini 2.5 Flash Image trägt. Es soll vor allem die Konsistenz bei der Veränderung von Personen und Tieren in Fotos verbessern und bietet weitere kreative Bildbearbeitungsmöglichkeiten.
Konsistenz als Kernfunktion
Ein bekanntes Problem bei der KI-gestützten Bildbearbeitung von Personen ist, dass kleine, aber wichtige Merkmale oft verloren gehen. Das Ergebnis wirkt dann zwar ähnlich, aber nicht authentisch. Das neue Modell soll genau hier ansetzen und sicherstellen, dass Freunde, Familie oder das eigene Haustier auch nach einer Bearbeitung – etwa mit einer Bienenkorbfrisur aus den 60er-Jahren oder einem Tutu für den Chihuahua – noch eindeutig wiedererkennbar bleiben.
Erweiterte Bearbeitungsmöglichkeiten
Über die verbesserte Konsistenz hinaus führt Google mehrere neue Funktionen ein, zum Beispiel die Möglichkeit, Fotos zu kombinieren: Nutzer können nun mehrere Bilder hochladen und miteinander verschmelzen. Als Beispiel nennt Google ein Porträt, das eine Person und ihren Hund gemeinsam auf einem Basketballplatz zeigt, obwohl die Originalfotos getrennt aufgenommen wurden.
Bild 1 von 10
)
Bilder lassen sich in mehreren aufeinanderfolgenden Schritten verändern. So kann ein leerer Raum zunächst mit Wandfarbe versehen, dann um ein Bücherregal und schließlich um weitere Möbelstücke ergänzt werden. Gemini behält dabei den Kontext des Bildes bei und verändert nur die gewünschten Bereiche.
Zudem soll es möglich sein, den Stil oder die Textur eines Bildobjekts auf ein anderes Bild zu übertragen. So lässt sich etwa die Textur von Blütenblättern auf ein Paar Gummistiefel anwenden oder ein Kleid mit dem Muster von Schmetterlingsflügeln gestalten.
Laut Google handelt es sich bei dem neuen Modell um das derzeit bestbewertete Bildbearbeitungsmodell im „Large Model Arena“-Benchmark. Die aktualisierte Funktion wird ab heute weltweit für alle Nutzer der Gemini-App ausgerollt, sowohl in der kostenlosen als auch in der kostenpflichtigen Variante. Alle in der App erstellten oder bearbeiteten Bilder werden zur Kennzeichnung mit einem sichtbaren Wasserzeichen sowie dem unsichtbaren digitalen Wasserzeichen SynthID versehen.
(mack)