Apps & Mobile Entwicklung

Hype-Modell im Alltagstest: Welche Fortschritte Googles Nano Banana Pro bei Infografiken macht


Im Rahmen des Starts der Gemini-3-Reihe aktualisiert Google auch die Bild-KI Nano Banana. Das Modell Nano Banana Pro (Gemini 3 Pro Image) wurde beim Reasoning und dem Faktenwissen optimiert. Damit soll es nun in der Lage sein, etwa bessere Infografiken zu erstellen.

Info-Grafiken sind bislang noch eine Baustelle bei den generativen KI-Systemen. Viral gehen immer wieder Beispiele, die beeindruckend aussehen. Im Alltag sind die Ergebnisse tendenziell eher durchwachsen bis banal oder erhalten gravierende Fehler.

Google: Visuelles Rezept mit Nano Banana Pro. Prompt: Create an infographic that shows how to make elaichi chai. (Bild: Google)

Was Google in dem Blog-Beitrag präsentiert, ist beeindruckend. Das gilt sowohl für das Hintergrundwissen zu einer Zimmerpflanze als auch zu einem Rezept. Wie viel lässt sich davon nun in den Alltag übertragen?

Alltagstest: Hält Nano Banana Pro, was Google verspricht?

Bei Rezepten lässt sich die Vorlage wiederholen. Fragt man etwa nach einem klassischen Cookie-Rezept, generiert Gemini ein grundsätzlich brauchbares Resultat, das optisch ansprechend die Zubereitung erklärt. Etwas unklar bleibt das Zusammenmixen mit dem Mehl. Als relevante Information fehlt zudem, dass man die Cookies bei Ober-/Unterhitze backen soll. Ein Ersatz für ein Rezept ist diese Infografik definitiv nicht, erfüllt als visueller Ratgeber aber ihren Zweck.

Gemini mit Nano Banana Pro generiert Cookies-Rezept
Gemini mit Nano Banana Pro generiert Cookies-Rezept – auf Deutsch
ChatGPT mit GPT-5.1 generiert Cookie-Rezept

Mit englischem Prompt fällt das Ergebnis besser aus als mit deutschem. Auf Deutsch fehlte im ersten Anlauf etwa die Zutatenliste, die wurde erst auf Nachfrage generiert. Dennoch generiert Nano Banana Pro ein Resultat, das besser ausfällt als das, was ChatGPT generiert.

Anmerkung: Das waren die ersten Ergebnisse, die die Modelle generiert haben. Mit Geduld und weiteren Eingaben lassen sich die Ergebnisse noch verbessern.

Bei der Snapdragon-3-Architektur scheitern die Modelle

Bei komplexeren Beispielen werden die Grenzen sichtbar. Die Aufgabe ist, die neue Snapdragon-Architektur X2 Elite visuell zu präsentieren. Grundlage für die Aufgabe ist die Tabelle aus dem entsprechenden Bericht. Der Prompt lautet: „Erstelle eine Infografik über die neue Snapdragon-Architektur basierend auf dieser Tabelle.

Technische Daten des Snapdragon X2 Elite (Extreme)

Was Nano Banana Pro daraus macht, ist optisch zumindest ansprechend. Weil das KI-Modell die verbundenen Zeilen im Bereich der SKU aber nicht korrekt interpretiert, schleichen sich Fehler ein. So werden etwa dem X2E 88 100 auch nur 12 Kerne zugerechnet, obwohl dieser 18 hat. Dasselbe Problem gibt es auch bei der GPU.

Infografik: Was ChatGPT (GPT-5.1) aus der Tabelle zur neuen Snapdragon-Architektur macht

Das Problem zeigt sich nicht nur bei Nano Banana Pro. ChatGPT schafft es ebenfalls nicht, den Unterschied bei den Snapdragon-X2-Elite-SKUs richtig zu interpretieren.

Fortschritte in vielen Bereichen

Bild-KIs kommen also mittlerweile auch in den Anwendungsbereichen voran, die im Alltag tatsächlich nützlich sind. Darüber hinaus verspricht Google weitere Fortschritte. Zu denen zählen schärfere Texte in Bildern, das nahtlosere Übertragen von Bildstilen sowie die Kombination mehrerer Bilder, um ein einziges zu erstellen.

Professionelle Produktion nimmt Google ebenfalls in den Blick. Mit einer verbesserten lokalen Bearbeitung lassen sich nun ein Teil eines Bildes auswählen, verfeinern und ändern. Anpassbar sind zudem Kamerawinkel, der Fokus, die Farbkorrektur und die Beleuchtung einer Szene – beispielsweise der Wechsel von Tag in Nacht oder das Erzeugen eines Bokeh-Effekts.

Bilder können in verschiedenen Seitenverhältnissen generiert werden, die Auflösung reicht bis auf 4K-Niveau. Damit sind diese laut Google sogar für Print geeignet.

Verfügbarkeit: Nano Banana Pro lässt sich über Gemini-App nutzen

Google verteilt das neue Nano-Banana-Pro-Modell weltweit über Gemini. Um es zu nutzen, muss man in der App die Option „Bilder erstellen“ und das „Thinking“-Modell auswählen. Nutzer der kostenlosen Gemini-Variante erhalten ein begrenztes kostenloses Kontingent. Ist es aufgebraucht, wechselt man wieder zum ursprünglichen Nano-Banana-Modell. Abonnenten von Google AI Plus, Pro- und Ultra erhalten höhere Kontingente.

Der KI-Modus in der Suche mit Nano Banana Pro ist in den USA für Abonnenten von Google AI Pro und Ultra verfügbar. Für NotebookLM ist Nano Banana Pro weltweit für Abonnenten verfügbar.

Die Bildgenerierung in Google Ads stellt Google ebenfalls auf Nano Banana Pro um. Entwickler können das Modell über die APIs in Googles Cloud-Diensten abrufen.



Source link

Beliebt

Die mobile Version verlassen