Apps & Mobile Entwicklung

Gemini erhält die beste KI der Welt für Bildbearbeitung


Hatten wir es uns doch gedacht: Ja, Google ist verantwortlich für „Nano Banana“. Google DeepMind hat das Werkzeug jetzt offiziell vorgestellt und damit steht jetzt auch fest: Die derzeit beste KI-Bildbearbeitung der Welt wird an alle Nutzer:innen von Google Gemini verteilt!

Okay, das kam jetzt ein bisschen aus dem Nichts: Eben hat Googles KI-Schmiede DeepMind offiziell ihre neue KI-Bildbearbeitung vorgestellt, über die wir jüngst erst berichteten. Nach den Indizien der letzten Tage war es schon wahrscheinlich, dass Google dahintersteckt.  Was wir nicht ahnen konnten: Dass Google das Tool so schnell offiziell macht – und es für alle Gemini-Nutzer:innen ankündigt. 

Deswegen ist „Nano Banana“ so gut

Die Bilder-Software kannten wir bislang unter dem Namen „Nano Banana“. Jetzt wird sie bei LMArena (der Plattform, in der KI-Modelle gegeneinander antreten und bewertet werden) als „gemini-2.5-flash-image-preview“ geführt. Dort seht Ihr übrigens auch die Top Ten, die zeigt, dass Google damit klar auf Platz 1 liegt – vor den Flux-Modellen (übrigens aus Deutschland) und GPT-Image-1 von OpenAI.

Wieso dieses Tool so gut ist, haben wir ja jüngst schon besprochen, aber Google erklärt es noch einmal deutlicher: 

Wir wissen, dass bei der Bearbeitung von Bildern von sich selbst oder von Personen, die man gut kennt, selbst subtile Fehler wichtig sind – eine Darstellung, die „fast, aber nicht ganz“ stimmt, fühlt sich nicht richtig an. Deshalb sorgt unser neuestes Update dafür, dass Fotos von Freund*innen, Familie und sogar Haustieren immer so aussehen, wie sie wirklich sind – egal, ob ihr einen Bienenkorb-Haarschnitt aus den 60er-Jahren oder ein Tutu für euren Chihuahua ausprobiert.

Also ja: Das neue Modell kann Euch wirklich so darstellen, wie Ihr ausseht, aber es kann noch mehr. Google nennt ein paar Beispiele, die Ihr austesten könnt:

Kostüm oder Ort ändern: Ladet einfach ein Bild hoch, egal ob von Euch, Familienmitgliedern oder sogar Eurem Haustier. Dann schreibt in den Prompt, wie Ihr zum Beispiel Eure Klamotten ändern wollt, oder den Ort, an dem Ihr Euch befindet. Die KI gehorcht aufs Wort und erschafft eine Version, die komplett mit der Bildervorlage übereinstimmt. 

Taucht an neuen Orten auf, verändert Euren Look – das ist mit Gemini alles möglich. / © Google DeepMind (Collage: nextpit)

Fotos zusammenfügen: Ladet einfach mehrere Fotos hoch. Es können zwei Fotos von Personen sein, die Ihr gern zusammen auf einem Bild hättet. Ladet noch ein drittes Foto mit hoch, auf dem ein einsamer Strand zu sehen ist und im Handumdrehen stehen die beiden Personen an exakt diesem Strand. Google hat in seinem Artikel u.a. das Beispiel von einer Frau und ihrem Hund gewählt. Beide als Foto hochgeladen und in den Prompt geschrieben, dass sie auf dem Bild mit ihrem Hund vor einem Basketballfeld abhängt. So sieht das dann aus: 

Nur ein Prompt, und Frauchen und Hund sind am selben Ort glücklich vereint. / © Google DeepMind (Collage: nextpit)

Damit hat Google augenscheinlich das größte Problem aller anderen Bilder-KIs gelöst: Bilder bleiben konsistent. Egal, ob Ihr den Hintergrund, die Bildkomposition, den Look oder die Haltung von Personen verändert – die Optik bleibt original erhalten. Das könnte jetzt für einen fetten Run auf Google Gemini sorgen, denn sagen wir, wie es ist: Ganz viele der durchschnittlichen ChatGPT-Nutzer:innen machen mit der KI-Plattform fast nichts, außer Bilder zu erstellen. Somit könnte „Nano Banana“ zu einem echten Gamechanger werden.

Mehrere Bearbeitungsschritte: Ihr könnt Euch Eure vorzunehmenden Veränderungen jetzt in einzelne Schritte einteilen. So könnt Ihr ein Foto eines leeren Raums im ersten Schritt nutzen, um beispielsweise die Wand in einer bestimmten Farbe streichen zu lassen. Dann lasst Ihr in einem weiteren Schritt Möbel hineinstellen. Zum Schluss haut Ihr dann Deko-Gegenstände ins Bild. Bei jedem dieser Schritte bleibt der Rest des Bildes unverändert, sodass Ihr am Schluss eben ein Werk erstellt habt, bei dem die Tapete und die Möbelauswahl immer noch exakt so aussieht wie vorher.

Wer kann diese Bilder-KI nutzen?

Wenn Ihr mit dem Tool herumexperimentiert, kommen Euch sicher noch unendlich mehr Ideen, was man damit anstellen kann. Ihr könnt das Design Eurer Bude und Eurer Klamotten ändern, verändert die Wohnzimmer-Einrichtung mit einem Prompt, oder lasst eine Person eine bestimmte Handtasche tragen. Die Frau soll ein Kleid tragen, das so gemustert ist wie der Schmetterling vom anderen Foto? Gar kein Problem!

Die Frage ist jetzt nur, ab wann steht uns das zur Verfügung und wem alles überhaupt? Google schreibt: „Die aktualisierte Bildbearbeitungsfunktion ist ab heute in Gemini verfügbar.“ Wir haben es in den Gemini-Apps und auch in der Web-Version bislang noch nicht gesehen. Im Google AI Studio wird es angezeigt, wirft aktuell aber nur Fehler raus. 

Vermutlich müssen wir Google also noch einen Augenblick Geduld geben. So lange könnt Ihr schon mal überlegen, welche Foto-Experimente Ihr starten wollt. Adobe kann sich derweil überlegen, was sie dann künftig machen wollen, wenn Leute viel weniger professionelle Foto-Software benötigen. 

Ach, und übrigens: Google hat auch erklärt, dass alle in Gemini erstellten oder bearbeiteten Bilder ein sichtbares Wasserzeichen enthalten. Ebenso gibt es ein unsichtbares digitales SynthID-Wasserzeichen, um deutlich zu machen, dass die Werke KI-generiert sind. Behaltet das im Hinterkopf beim Bilder-Generieren! Lasst uns doch gerne in den Kommentaren wissen, ob die Funktion bei Euch schon angekommen ist – und was Ihr von ihr haltet.



Source link

Beliebt

Die mobile Version verlassen