Apps & Mobile Entwicklung

Gemini Intelligence: Google macht Android 17 zum Agenten-Betriebssystem


Google treibt mit Gemini Intelligence die Automatisierung voran und macht Android 17 damit zu einem Agenten-Betriebssystem, das teils eigenständig agieren und den Nutzer bei alltäglichen Aufgaben unterstützen kann. Gemini Intelligence kommt zuerst auf Pixel- und Samsung-Galaxy-Smartphones. Android 17 bietet aber noch mehr Neues.

Mit Slogans wie „AI is the new UI“ wird im aktuellen KI-Zeitalter von einigen der Big-Tech-Player darauf hingearbeitet, dass Anwender mehr mit einer Künstlichen Intelligenz interagieren, die dann die jeweiligen Aufgaben (automatisiert) ausführt, anstatt Apps selbst zu starten und innerhalb dieser in sich geschlossenen „Silos“ zu arbeiten.

Was ist ein Agent?

In diesem Zusammenhang ist bei KI auch von Agenten die Rede. Ein KI-Agent ist ein Programm mit künstlicher Intelligenz, das selbstständig Aufgaben ausführen kann. Anders als ein normaler Chatbot reagiert ein KI-Agent nicht nur auf einzelne Fragen, sondern kann Ziele verfolgen, Informationen sammeln, Entscheidungen treffen und Aktionen ausführen – zum Beispiel Termine planen, E-Mails beantworten oder Daten analysieren. Dabei nutzt er oft Sprachmodelle, Werkzeuge und Zugriff auf andere Programme, um Probleme möglichst eigenständig zu lösen. Er wird „Agent“ genannt, weil er ähnlich wie ein menschlicher Assistent eigenständig handelt: Er nimmt Informationen wahr, verfolgt ein Ziel und führt passende Aktionen aus, statt nur auf einzelne Befehle zu reagieren.

Gemini Intelligence kann Aufgaben übernehmen

Unter dem Oberbegriff „Gemini Intelligence“ führt Google neue KI-Funktionen ein, die im Verlauf des Sommer zuerst auf Endgeräten von Google selbst und Samsung Einzug halten sollen. Sie sollen aber generell auf Android-Endgeräten zur Verfügung stehen, also auch Smartwatches, Smart Glasses, im Auto und auf den neuen Googlebooks.

Gemini Intelligence soll in Android in erster Linie für einen gewissen Grad der Automatisierung sorgen, demnach als Agent eigenständig ausgewählte Aufgaben ausführen. In den USA und in Südkorea führt Gemini bereits seit Februar mehrstufige Anfragen automatisiert im Hintergrund aus. Die neue App-Automatisierung umfasst zum Beispiel das Buchen von Sportkursen in unterstützten Apps oder das Heraussuchen eines Lehrplans in Gmail und die dazu passende Online-Bestellung von Büchern. Gemini sei für die Logistik verantwortlich, während der Nutzer sich um andere Dinge kümmern kann, erklärt Google.

Gemini kann Anfragen über mehrere Apps hinweg ausführen (Bild: Google)

Gemini kann nach Opt-in den Bildschirm auslesen

Mehr Kontext soll Gemini über den Zugriff auf den Bildschirm oder den Upload eines Bildes erhalten. Eine Einkaufsliste aus der Notizen-App kann Gemini auslesen und daraufhin eigenständig den Warenkorb füllen und eine Bestellung ausführen. Eine interessante Reisebroschüre in der Hotellobby entdeckt? Die Lösung: Ein Foto für Gemini knipsen und nach einer passenden Tour für sechs Personen auf Expedia fragen. Der Agent kann daraufhin alle weiteren Schritte der Buchung selbst vornehmen, aber wartet im letzten Schritt noch auf eine manuelle Bestätigung durch den Anwender.

Gemini only acts on your command and stops the moment the task is complete. All
that’s left for you is the final confirmation.

Google

Android kann mehr Formulare ausfüllen

Das Betriebssystem soll Anwender auch beim Ausfüllen von Formularen besser unterstützen. Dafür wird „Autofill with Google“ mit Gemini und Personal Intelligence verknüpft – aber nur dann, wenn vom Nutzer per Opt-in bestätigt. Selbst komplexe Formulare mit sehr vielen Textfeldern soll das Betriebssystem dann eigenständig ausfüllen können. Die benötigten Informationen kann sich Gemini nach dem Opt-in selbst aus dem Datenbestand des Endgerätes zusammensuchen. Das funktioniert in unterschiedlichsten Apps, darunter auch der Browser, den Google mit Gemini ebenfalls intelligenter machen und zu einer agentischen App wandeln will.

https://pics.computerbase.de/1/2/2/4/9/5-fad19cd3565faa57/8-1280.fca0b697.mp4
GIF Autofill mit Personal Intelligence (Bild: Google)

Gboard versteht das Diktieren in natürlicher Sprache

Das Gboard, Googles Tastatur, erfährt mit „Rambler“ ein Upgrade, um aus natürlicher Sprache bessere Textnachrichten zu erstellen, die gewisse Füllwörter wie „ums“ und „ahs“ oder die im Englischen beliebten „likes“ beim Diktieren herausfiltern. Rambler ist Teil von Google Intelligence und soll dafür sorgen, dass Anwender beim Diktieren nicht mehr über jedes einzelne Wort nachdenken müssen, sondern vollständig natürliche Sprache mit geläufigen Denkpausen und Füllwörtern nutzen können.

Neue Widgets per Prompt erstellen

Der generative Aspekt von Gemini zeigt sich in Android 17 mit den per Prompt erstellbaren Widgets. Mit „Create My Widget“ können Anwender per Gemini-Prompt ihre eigenen Android-Widgets erstellen, die dann spezifische Aufgaben ausführen oder Anzeigen bereitstellen können. Ein Koch-Widget kann dem Anwender zum Beispiel fortlaufend proteinreiche Rezepte erstellen oder ein angepasstes Wetter-Widget nur Informationen zur Windgeschwindigkeit und Niederschlag ausgeben. „Create My Widget“ soll neben Smartphones auch auf Wear OS kommen.

Gemini kann per Prompt Widgets erstellen (Bild: Google)

Gemini Intelligence kommt dabei auf allen Google-Plattformen im neuen Design von Material 3 Expressive. Googles letztes Jahr erstmals eingeführte Designsprache setzt auf kräftige Farben, flexible Formen, größere Typografie und fließende Animationen, um die Benutzeroberfläche persönlicher, lebendiger und intuitiver wirken zu lassen.

Android 17 erhält mehrere Upgrades

Abseits der agentischen Fähigkeiten spendiert Google dem Betriebssystem weitere Features wie die neuen Screen Reactions, mit deren Hilfe Anwender den Bildschirm und parallel sich selbst als Overlay filmen und dabei auf den Bildschirminhalt reagieren können, ohne dafür einen Greenscreen zu benötigen. Das Feature soll im Sommer zuerst auf Pixel-Smartphones kommen.

Upload-Pipeline für Instagram in höherer Qualität

Google verändert zudem die Upload-Pipeline für Social Media, damit Uploads auf Instagram dieselbe oder sogar eine höhere Qualität aufweisen als unter iOS. Auch unter Android werden jetzt Ultra-HDR-Uploads, die Videostabilisierung und die Nachtsicht unterstützt. Exklusiv für Android sind das KI-Upscaling von Fotos und Videos sowie das Trennen der Tonspur vom Video, um daran Veränderungen in der Edits-App von Instagram vorzunehmen. Und nach der nativen iPad-Unterstützung gibt es Instagram jetzt auch unter Android in einer Tablet-Version.

https://pics.computerbase.de/1/2/2/4/9/5-fad19cd3565faa57/1-624.157d11c4.mp4
GIF Smart Enhance in Instagram (Bild: Google)
Instagram-App für Android-Tablets (Bild: Google)

Adobe Premiere für Android

Für professionelle Anwender kommt Adobe Premiere nach dem Apple-Ökosystem „diesen Sommer“ auch auf Android und bietet dort auch Vorlagen und Effekte speziell für YouTube Shorts. Auch den von Samsung mitentwickelten und von Qualcomm unterstützten APV-Codec (Advanced Professional Video) will Google vermehrt fördern.

Apps können Pausen empfehlen

Den Bereich „Digitales Wohlbefinden“ erweitert Google in Android 17 über die Bildschirmzeit hinaus um den neuen „Pause Point“, um Anwender bei langer monotoner App-Nutzung zu mehr Auszeiten zu bewegen. Pause Point kann Nutzer in „ablenkenden Apps“ zu kleinen Pausen von zum Beispiel 10 Sekunden motivieren oder zu einem Wechsel zu einer anderen App anregen. Pause Point lässt sich dabei auch so einstellen, dass es sich erst nach einem Neustart des Smartphones wieder deaktivieren lässt.

Pause Point für Android-Apps (Bild: Google)

3D-Emoji erscheinen plastischer und realistischer

Neue Emoji halten – angefangen mit Pixel – ebenfalls Einzug, dieses Mal in neuer 3D-Ausführung, womit die Emoji plastischer und realistischer erscheinen sollen.

Neue 3D-Emoji in Android 17 (Bild: Google)

Einfacher von iOS zu Android umziehen

Den Umzug auf die Android-Plattform will Google vereinfachen, indem gemeinsam mit Apple ein neuer Transferprozess entwickelt wurde, der Passwörter, Fotos, Nachrichten, Apps, Kontakte und Homescreen-Layouts umfasst. Im weiteren Verlauf des Jahres soll der drahtlose Transferprozess auch eSIM-Profile umfassen.

Das Teilen von Dateien auf unterschiedlichen Plattformen wird ebenfalls erweitert. Das zu AirDrop von Apple kompatible Quick Share ist nach der Verfügbarkeit für Google und Samsung im weiteren Verlauf des Jahres auch für Smartphones von Honor, OnePlus, Oppo und Xiaomi vorgesehen. Quick Share kann zum Teilen von inkompatiblen Smartphones auch einen QR-Code für iOS-Geräte generieren. Außerdem soll Quick Share in Apps wie unter anderem WhatsApp integriert werden.

QR-Code als Quick-Share-Alternative (Bild: Google)

ComputerBase hat Informationen zu diesem Artikel von Google unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.



Source link

Beliebt

Die mobile Version verlassen