UX/UI & Webdesign

Wie gut ist Gemini 3 Pro Image wirklich? › PAGE online


Googles neues Gemini-3-Bildmodell »Nano Banana Pro« sorgt für Druck im KI-Wettrennen und legt ausgerechnet bei Text, Details und Grafiken am stärksten zu. KI-Expertin Jana Reske hat getestet, was sich wirklich verändert hat.

Wie gut ist Gemini 3 Pro Image wirklich? › PAGE online
Die Haare sind deutlich detaillierter und weniger weichgezeichnet als bei der Vorgängerversion. Das rechte Bild sieht fast wie ein echtes Foto aus.

Anfang Dezember machte ein internes Memo von Sam Altman die Runde. Ein ungewohnt offener Warnruf an die OpenAI-Teams, dass die nächsten Monate »schmerzhaft« werden könnten. Weil Google mit Gemini 3 auf einmal verdammt gut geworden ist. Das Timing hätte kaum interessanter sein können: Nur wenige Tage später launcht Google Nano Banana Pro, das neue Gemini-3-Pro-Imagemodell, das prompt als »Game Changer« durch die Feeds rauscht.

Zeit also, sich das Tool im Detail anzuschauen: Was kann Nano Banana Pro? Wo setzt Google tatsächlich neue Standards und wo bleibt das Modell hinter der großen Erzählung zurück?

Für diesen Test habe ich eigene Business-Porträts und Infografiken generiert, sowohl mit dem bisherigen Nano Banana als auch mit dem neuen Pro-Modell, um den Unterschied zu testen und die Relevanz für Branding, Design und visuelle Produktion einzuschätzen.

Einfach im Browser: So schlägt sich Nano Banana Pro im Praxischeck

Nano Banana Pro läuft wie sein Vorgänger direkt im Gemini-Interface und lässt sich ohne zusätzliche Software im Browser bedienen. Nutzer:innen können eigene Fotos als Referenz hochladen, um eine höhere Konsistenz zu erzielen, müssen das aber nicht zwingend tun. Für meinen Test habe ich sowohl mit als auch ohne Referenzbilder gearbeitet, um die Unterschiede in der Treue zum Prompt und Bild besser vergleichen zu können.

Auf den ersten Blick sieht die Oberfläche von Google Gemini so aus wie die von fast allen anderen LLMs auch. Nichts besonderes also?

Der Prompt kann sehr einfach gehalten sein, wird aber vor allem dann stark, wenn er präzise formuliert wird. Das neue Modell reagiert deutlich differenzierter auf Details. Der Workflow selbst ist bewusst reduziert: Man gibt einen Prompt ein und erhält ein einzelnes Bild. Es gibt keine vier Varianten wie bei MidJourney und Co., sondern eher einen »ein Bild pro Versuch«-Ansatz, bei dem man entweder den Prompt anpasst oder die Generierung erneut auslöst. Dazu kommt: Ohne Pro-Abo erlaubt Google lediglich drei Generierungen pro Tag mit Nano Banana Pro. Während drei Pro-Bilder pro Tag für erste Experimente ausreichen, ist diese Beschränkung für jede regelmäßige Nutzung eher ein Ausschlusskriterium. Google macht damit deutlich, dass ernsthafte Arbeit mit Nano Banana Pro künftig nur über das Abo-Modell laufen wird.

Der Unterschied von Gemini 2.5 Flash Image zu Gemini 3 Pro ist größer als gedacht

Im direkten Vergleich wurde sehr schnell deutlich, dass Nano Banana Pro gegenüber dem bisherigen Nano Banana deutlich zugelegt hat. Die Unterschiede zeigen sich vor allem in den Gesichtern: Haut, Haare, Texturen und feine Details wirken realistisch und sauber gerendert, ohne den typischen »KI-Schimmer«, den man aus älteren Modellen kennt. Dabei ist nicht nur die Bildqualität an sich spürbar gestiegen: Auch die Dateigröße der generierten Bilder hat sich mehr als verdoppelt, was sich in noch schärferen Details und einer insgesamt höheren visuellen Klarheit bemerkbar macht. Auch die Ähnlichkeit zu den eingereichten Referenzfotos ist spürbar höher. Gerade bei Portraits, Headshots und Branding-Material ist das ein enormer Vorteil. Die Schärfe und Auflösung der Bilder sind klar verbessert. In meinem Test, in dem ich Business-Porträts mit identischen Prompts erzeugt habe, lieferte die Pro-Version jedes Mal die präzisere, hochwertigere und überzeugendere Variante. Für LinkedIn-Profilbilder, Website-Porträts und Social-Media-Motive ist das Modell damit einen großen Schritt näher an professionellen Fotoproduktionen.

Der Unterschied ist auf den ersten Blick leicht zu erkennen: Die Details und die Auflösung von Google Gemini 3 Pro sind deutlich besser.
Hier sind die Haare deutlich detaillierter und weniger weichgezeichnet als bei der Vorgängerversion. Das rechte Bild sieht fast wie ein echtes Foto aus.

Wie sieht es bei Gemini 3 Pro mit Infografiken aus?

Auch bei einer kleinen Infografik-Probe wurde es spannend: Ich habe denselben Prompt einmal mit der normalen Nano-Banana-Version und einmal mit der Pro-Variante ausgegeben. Beide Modelle setzen Text überraschend sauber und korrekt um. Deutlich besser, als man es aktuell von ChatGPT oder anderen KI-Modellen kennt, die bei der Visualisierung von Text noch sichtbar Probleme haben. Im direkten Vergleich zeigt sich jedoch erneut der Vorsprung der Pro-Variante: Die Infografik wirkt klarer, typografisch präziser und visuell stimmiger. Layout, Komposition und Detailtiefe liegen spürbar über dem Niveau des Standardmodells, das solide Ergebnisse liefert, aber weniger »Editorial Finish« hat. Allerdings ist auch das Search-Grounding noch nicht vollständig transparent. Obwohl das Feature spannende Möglichkeiten bietet, ist unklar, welche Informationen das Modell tatsächlich einbezieht.

Die Entwicklung, besonders im grafischen Bereich, ist beeindruckend. Da scheint die Sorge von Sam Altman, dass OpenAI sich Sorgen machen muss, gerechtfertigt.

Nano Banana Pro zeigt kaum Schwächen im Umgang mit surrealen oder Fantasie-Szenarien. Prompts wie »Person als Fee in einem verwunschenen Wald« werden überraschend konsistent und detailreich umgesetzt. Die Bildwelten wirken stimmig und überzeugend. Auffällig ist jedoch, dass das Modell weibliche Figuren wenig bekleidet darstellt, auch wenn Kleidung oder Aussehen nicht definiert wurden. Dies verdeutlicht erneut, wie KI-Bildmodelle Vorstellungen von Geschlecht beeinflussen und reproduzieren. Ein Phänomen, das ich in meinen eigenen Tests zu Gender-Darstellungen in KI-Bildern bereits beobachtet habe.

Auch fantasievolle und nicht reale Kontexte und Hintergründe funktionieren mit dem neuen Update gut. Sie sind deutlich detaillierter und realistischer.

Was bedeutet dieses Upgrade für Designer:innen und für alle, die mit Bildern Geld verdienen?

Für die Design- und Kreativbranche ist Nano Banana Pro dennoch ein hoch relevantes Release. Infografiken und Grafiken entstehen schneller und präziser, und die Möglichkeit, Text direkt sauber ins Bild einzubetten, ist ein echter Durchbruch. Bisher einer der größten Schwachpunkte generativer Bildmodelle. Auch im Bereich Businessporträts und Corporate Branding verändert Nano Banana Pro den Workflow: KI-Bildgenerierung erreicht ein Niveau, das klassische Shootings zumindest teilweise ergänzt oder ersetzt. Doch der Fortschritt hat auch seine Kehrseite. Gerade weil Nano Banana Pro im Bereich Businessporträts sehr gute Ergebnisse liefert, die klassische Shootings zumindest teilweise ersetzen können, steht die Frage im Raum, wie sich das auf Fotograf:innen, Retoucher:innen oder kleine Studios auswirkt. Was für Freelancer:innen, Creator und kleine Unternehmen enorme Zeit- und Kostenvorteile bringt, könnte für Andere in der Branche zu realen wirtschaftlichen Einschnitten führen.

Das Update macht jedoch deutlich, in welche Richtung Google steuert: weg von der experimentellen KI-Spielwiese und hin zu einem Werkzeug, das produktive Arbeit erleichtert und beschleunigt. Genau deshalb wirkt Nano Banana Pro wie ein Beschleuniger im aktuellen KI-Wettrennen und erscheint als plausibler Auslöser für die Unruhe, die Sam Altman in seinem Memo andeutet.



Source link

Beliebt

Die mobile Version verlassen