Apps & Mobile Entwicklung

So betretet Ihr bald jedes Bild



Stellt Euch vor, wie Ihr vor einem riesigen Gemälde steht. Das Bild zieht Euch in den Bann, Ihr geht näher herein – und dann steigt Ihr einfach ein und befindet Euch selbst im Gemälde und bewegt Euch durch die Welt, die eigentlich nur auf Leinwand erschaffen wurde. Unmöglich? Nicht ganz!

Ja, wir haben immer schon versucht, die Grenzen von Kunstwerken zu sprengen. Vor einigen Jahren staunten wir, wenn wir Meisterwerke sahen, die per sogenanntem Outpainting erweitert wurden. Das bedeutet, dass generative KI das Bild erweiterte – plötzlich konnte man also die Beine der Mona Lisa sehen, oder das Zimmer, in dem sie gemalt wurde.

Der nächste Step war dann, dass wir Bilder in Videos verwandeln konnten. Leonardo da Vincis Mona Lisa konnte uns jetzt also zum Beispiel zuzwinkern oder winken. Jetzt hat Google DeepMind, Googles KI-Schmiede, einen wirklichen Schritt nach vorn gemacht. So können wir Kunst in Zukunft ganz neu und anders kennenlernen. 

Taucht ein ins Gemälde und erlebt eine neue Welt

Mit Genie 3, so heißt das KI-Modell, kann Google konsistente, navigierbare Welten erstellen. Ihr könnt also per Prompt eine Welt schaffen, durch die Ihr wie in einem Computerspiel navigiert. Seht Euch das Video an und Ihr seht, was ich meine: 

Es geht aber eben auch anders, und das zeigt uns Aleksander Holynski. Er ist Wissenschaftler im DeepMind-Team und hat Genie 3 nicht mit einem Prompt genutzt – sondern, indem er der KI ein berühmtes Gemälde präsentierte: „Nighthawks“ von Edward Hopper, also jenes legendäre Bar-Gemälde.

Was jetzt passiert? Ihr könnt durch das Bild navigieren. Ihr seht also, was sich links und rechts des Bildrandes im Originalwerk befindet. Aber nicht nur das: Ihr könnt auch die Bar verlassen und die nächtlichen Straßen rund um diese so berühmte Kneipe erkunden. Ihr wollt einmal unter dem Nachthimmel von Vincent van Goghs Meisterwerk „Sternennacht“ spazieren, oder einmal um die Mona Lisa herumtanzen? Das werdet Ihr tun können, sobald Google diese Technologie für die Allgemeinheit freigibt!

Diese bahnbrechende Technologie steckt dahinter

Aktuell können außer im Google-DeepMind-Team nur wenige Auserwählte mit dieser Technologie experimentieren, aber die Ergebnisse sind jetzt schon sensationell, wie Ihr oben seht. Die Besonderheit dabei ist, dass Google jetzt bereits 3D-Welten aus einem Prompt schaffen kann, die minutenlang konsistent bleiben. Das bedeutet, Ihr könntet Hoppers Bar verlassen, durch die Stadt marschieren und Euch Minuten später wieder vor dem Tresen einfinden.

Aktuell ist diese erschaffene Welt, wie gesagt, nur einige Minuten lang konsistent. Die Videos werden mit HD-Auflösung von 720 Pixeln erstellt und mit 24 fps dargestellt. Bereits jetzt ist es möglich, dass Ihr in dieser erstellten Welt mittels Prompt eingreifen könnt. Wenn Ihr Euch in der Bar befindet, reicht also ein einziger Textprompt, und Ihr lasst eine Blaskapelle den Laden betreten oder was auch immer in Eurer Fantasie ist. 

Das ist aktuell vielleicht nicht mehr als eine Spielerei, aber denkt das bitte mal weiter. Aus einem Bild, auf dem Arbeiter in luftiger Höhe auf einem Stahlträger sitzen, könnte man im Handumdrehen ein Plattform-Spiel erschaffen. Oder denkt mal nicht an Kunstwerke, sondern private Fotos: Auf einmal steht Ihr wieder vor der Bühne Eurer Lieblingsband oder erweckt die lustige Hausparty von 1990 wieder zum Leben. 

Ja, KI ist oft creepy und beunruhigend. Aber die Technologie dahinter wird uns künftig komplett neue, immersive Erlebniswelten öffnen, versprochen! 





Source link

Beliebt

Die mobile Version verlassen