Apps & Mobile Entwicklung

Die besten Funktionen erklärt und im Überblick

Was ist Gemini?

Wenn Ihr ein Android-Smartphone oder -Tablet benutzt, habt Ihr Gemini wahrscheinlich schon kennengelernt. Aber wenn Ihr mit diesem neuen KI-Assistenten noch nicht ganz vertraut seid, hier ein kurzer Überblick.

Gemini ist der neue KI-Assistent von Google, der den Google Assistant bei Sprachabfragen, Befehlen und Aufgaben ersetzen soll. Noch sind nicht alle Funktionen und Erweiterungen ausgerollt, aber im Laufe der Zeit werden weitere Updates eingeführt.

Gemini zeichnet sich durch seine fortschrittlichen KI-Fähigkeiten aus, die ihn im Vergleich zum Google Assistant konversationeller und natürlicher in der Interaktion mit den Nutzern machen.

Die wichtigsten Funktionen von Gemini

Jetzt, wo Ihr mit den verschiedenen Versionen vertraut seid, wollen wir uns die wichtigsten Funktionen von Gemini ansehen.

1. Multimodale KI für Bild, Text & mehr

Einer der größten Vorteile von Gemini sind seine multimodalen Fähigkeiten. Während Google Assistant Sprach-, Text- und Bildeingaben unterstützt, geht Gemini noch einen Schritt weiter und ermöglicht es Nutzern, mit Videos, Code und sogar Dateien zu interagieren. Der smarte KI-Chatbot kann sich mit Gemini Live auch in Echtzeit an Konversationen beteiligen und neben Text auch Bilder und Videos ausgeben.

Gemini unterstützt verschiedene Eingabearten, was ihn zu einem vielseitigen KI-Assistenten macht:

Text
Dateien oder Dokumente
Bilder
Video
Audio
Code

Nutzt das! Oft ist es viel einfacher, Gemini ein Foto oder ein kurzes Video zu schicken als eine Situation ausführlich zu beschreiben.

2. Bilder generieren

Gemini enthält ein Tool zur Generierung von Bildern aus Text, das sowohl in der kostenlosen als auch in der Premium-Version verfügbar ist. Die Premium-Version kann komplexere Bilder erstellen, z. B. Porträts von Menschen. Sie verwendet das neueste Imagen-3-Modell von Google, das eine verbesserte Bildqualität und Anpassungsmöglichkeiten bietet.

So benutzt Ihr den Bildgenerator:

Öffnet die Gemini-App auf Eurem Gerät.
Tippt oder sprecht Eure Eingabeaufforderung, beginnend mit „erstelle“, „generiere“ oder „zeichne“.
Legt Stile, Farben und Beschreibungen fest.
Tippt auf den Senden-Button und wartet auf das Ergebnis.

Tippt oder sprecht einen Prompt ein, um mit der Bildgenerierung zu starten. © nextpit

Ihr könnt hinterher den Prompt noch anpassen, um einen bestimmten Stil zu erreichen. © nextpit

Ihr könnt Eure Eingabeaufforderungen für bessere Ergebnisse verfeinern und die Bilder direkt in der App speichern oder teilen. Weitere Informationen zu diesem Thema findet Ihr in unserem Leitfaden zum Erstellen und Speichern von KI-Bildern mit Gemini.

3. Texte und Videos zusammenfassen

Gemini kann lange Texte, E-Mails, Dokumente und YouTube-Videos zusammenfassen. Um diese Funktion zu nutzen, müsst Ihr die Google Workspace und YouTube Erweiterungen in der App aktivieren.

So fasst Ihr Texte zusammen:

Öffnet die Gemini App.
Fügt den Text oder die URL in das Eingabefeld ein oder tippt sie ein.
Drückt auf den Senden-Button und erhaltet die Zusammenfassung.

In Euren Prompt könnt Ihr URLs, Dokumente & Co. einbauen und Gemini damit arbeiten lassen, um beispielsweise eine Zusammenfassung zu erstellen. © nextpit

Ihr könnt die Ergebnisse direkt in Google Docs exportieren. © nextpit

So fasst Ihr YouTube-Videos (mit aktivierten Untertiteln) zusammen:

Öffnet das YouTube-Video.
Startet oder ruft Gemini auf.
Tippt oder sprecht: „Dieses Video zusammenfassen“.

Sogar YouTube-Videos lassen sich zusammenfassen, … © nextpit

… wenn Ihr auf die passende Schaltfläche „Ask About Video“ drückt. © nextpit

Gemini kann auch wichtige Informationen wie Rezepte oder Menüs aus den Videountertiteln extrahieren. Mehr dazu erfahrt Ihr in unserem Tutorial, in dem wir erklären, wie Ihr mit Gemini YouTube-Videos zusammenfasst.

4. Fragt nach, was auf dem Bildschirm zu sehen ist

Eine der nützlichsten Funktionen von Gemini sind die kontextbezogenen Infos via „Ask About Screen“. Damit könnt Ihr Erklärungen und Einblicke zu Bildern und Webseiten erhalten – so wie Google Lens, nur mit zusätzlichen KI-Funktionen.

So nutzt Ihr „Ask About Screen“

Öffnet ein Bild oder eine Webseite (oder nehmt ein neues Foto auf).
Startet Gemini über eine Geste oder einen Shortcut.
Tippt auf „Ask about Screen“ (es wird ein Screenshot gemacht und hochgeladen).
Tippt oder sprecht Eure Frage über den Inhalt.
Drückt auf Senden.

Ihr könnt Bilder und Webseiten ebenfalls mit Gemini durchsuchen. © nextpit

Fragt was Ihr wollt zu dem aktuell dargestellten Inhalt. © nextpit

Die Ergebnisse in Textform könnt Ihr dann speichern und teilen. © nextpit

Text lässt sich ebenfalls ganz einfach extrahieren und sogar übersetzen. © nextpit

Ihr könnt auch manuell ein Foto zur Analyse in die Gemini-App hochladen oder Text aus Webseiten extrahieren, um ihn zusammenzufassen, zu erklären oder zu übersetzen.

5. Nach PDF-Dateien fragen

Die Funktion „Ask About PDF“ funktioniert ähnlich wie „Ask About Screen“, konzentriert sich aber auf PDF-Dokumente. Ihr könnt Texte zusammenfassen, extrahieren oder nach bestimmten Daten in einer Datei suchen. Diese Funktion ist ideal, um schnell wichtige Informationen aus langen Dokumenten zu extrahieren.

Während diese Funktion in der Basis- und der Premium-Version von Gemini verfügbar ist, könnt ihr in der Pro-Version komplexere und größere PDF-Dateien mit einem leistungsfähigeren Modell bearbeiten.

So benutzt Ihr Ask About PDF

Startet die Google Files App.
Öffnet ein PDF-Dokument.
Startet Gemini per Geste und tippt dann auf Ask about PDF.
Wartet, bis die Datei hochgeladen ist.
Gebt Eure Anfrage ein und tippt dann auf Senden.

Drückt dazu einfach auf diese Schaltfläche. © nextpit

Ihr könnt auch ein PDF-Dokument hochladen und es befragen. © nextpit

Das klappt per Sprache oder Texteingabe. © nextpit

Die generierten Ergebnisse könnt Ihr anschließend einfach kopieren und teilen. © nextpit

6. Gemini mit Gmail und Kalender verwenden

Gemini lässt sich nahtlos in Google-Apps integrieren und erleichtert so die Aufgabenverwaltung. Es kann zum Beispiel Flugdetails aus Gmail extrahieren und sie als Ereignisse im Google Kalender hinzufügen.

So verwendet Ihr Gemini für Kalenderereignisse

Bittet Gemini, Flugdetails oder Flugpläne aus Google Mail abzurufen.
Fügt Ereignisse direkt im Google Kalender hinzu oder ändert sie, indem Ihr im Kalender auf Weiter tippt.

Ihr könnt auch persönliche Daten einfließen lassen, beispielsweise von Gmail oder Eurem Kalender. Das klappt etwa mit Meetings, Flugdaten & Co. © nextpit

Wenn Ihr auf die entsprechende Schaltfläche drückt, geht’s direkt zum Kalender. © nextpit

Gemini kann auch Termine in E-Mails erkennen, die gerade im Web verfügbar sind, damit Ihr sie schnell zu Eurem Kalender hinzufügen könnt.

7. Analysen und Erstellen von Visualisierungen

Gemini kann Daten aus Tabellenkalkulationen, Folien und Dokumenten analysieren und sie in einer leicht verdaulichen Präsentation visualisieren oder die interessantesten Erkenntnisse und Muster über Bilder oder interaktive Diagramme über Canvas bereitstellen.

So erstellt Ihr visuelle Diagramme und Tabellen mit Gemini

Startet Gemini.
Tippt auf die Schaltfläche + und wählt Dateien.
Ladet Eure Tabelle hoch (Excel, Sheets oder CSV).
Beginnt Euren Prompt mit „Visualisiere …“ oder „Erstelle ein (Balken-)Diagramm aus den folgenden Daten“.

Neben PDF-Dateien kann Gemini auch mit CSV-Files umgehen. © nextpit

Sagt einfach, wie Gemini die Daten aufbereiten soll: Als Trend, Kurve oder Diagramm? © nextpit

8. Code für interaktive und kollaborative Visualisierungen über Canvas erhalten

Mit der Canvas-Funktion in Gemini könnt Ihr umfangreichere und interaktive Inhalte wie Infografiken, Quizze und Apps in einem Dokument oder einem Code erstellen. Sie ist sowohl für kostenlose als auch für kostenpflichtige Gemini-Apps verfügbar. Kostenpflichtige Nutzer/innen erhalten Zugang zum neuesten und leistungsfähigeren Gemini-Modell, das eine verbesserte Leistung hat und größere Projekte bearbeiten kann.

So benutzt Ihr Canvas:

Startet Gemini.
Tippt auf die Schaltfläche „Mehr“ (oft ein „+“-Symbol) in der Eingabeaufforderungsleiste und wählt Canvas.
Gebt Euren Prompt ein, um das Dokument, den Code oder den interaktiven Inhalt zu beschreiben, den Ihr erstellen möchtet. Ihr könnt auch unterstützte Dateien (wie PDFs oder Bilder) hochladen, um Euren Prompt zu beschreiben.
Wartet darauf, dass der Inhalt generiert ist.

Wählt hier „Canvas“ bevor Ihr den Prompt eintippt, um ein interaktiveres Ergebnis zu bekommen. © nextpit

Die generierten Daten könnt Ihr wieder exportieren und den Code testen und/oder bearbeiten. © nextpit

Bei Dokumenttypen könnt Ihr die Datei ansehen oder herunterladen. Den Code könnt Ihr sowohl im Web als auch auf mobilen Plattformen direkt in Canvas in der Vorschau anzeigen lassen, und es gibt Optionen zum Teilen und Bearbeiten des Codes.

9. Verwendet Gemini auf dem Sperrbildschirm

Gemini übernimmt die Funktionen des Google Assistant auf dem Sperrbildschirm, wie z. B. das Einstellen eines Weckers oder eines Kalenderereignisses, das Lesen von Benachrichtigungen oder das Beantworten von Anrufen, sodass Nutzer/innen Aufgaben ausführen können, ohne ihr Gerät zu entsperren.

So aktiviert Ihr Gemini auf dem Sperrbildschirm

Öffnet die Gemini-App.
Tippt auf Euer Profilbild.
Geht zu Einstellungen > Gemini auf dem Sperrbildschirm.
Aktiviert Gemini ohne Entsperrung verwenden.
Schaltet Anrufe tätigen und Nachrichten senden ohne Entsperren ein.

Geht in die Einstellungen von Gemini und wählt „Gemini on Lock Screen“ aus. © nextpit

Sind die beiden Schalter aktiviert, steht Euch Gemini auf dem Lockscreen zur Verfügung. © nextpit

10. Smart Home-Geräte mit Gemini steuern

Wie Google Assistant kann auch Gemini Smart Home-Geräte steuern. Ihr müsst Eure Geräte in der Google Home App hinzufügen und Drittanbieter-Apps wie Xiaomi Mi Home oder Samsung SmartThings verknüpfen.

Hier ist ein Beispiel, wie Ihr einen smarten Luftreiniger steuert:

Fügt Euer Smart Home-Gerät in der Home-App hinzu.
Startet Gemini.
Schreibt oder sprecht den Befehl und gebt dabei den Gerätenamen und die Aktion an.
Tippt auf Senden.

Bittet Gemini, ein mit der Home-App verbundenes Smart Home-Gerät ein- oder auszuschalten. © nextpit

11. Chattet und teilt Eure Kamera mit Gemini Live

Gemini Live bietet natürliche, kontinuierliche Unterhaltungen. Die kostenlose Version bietet fast die gleichen Funktionen wie die Premium-Version, wobei letztere tiefere Interaktionen ermöglicht, einschließlich Gesprächsprotokollen zum späteren Nachschlagen. Folgt der Anleitung, um Gemini Live zu nutzen.

Startet Gemini.
Tippt auf die Schaltfläche Gemini Live.
Beginnt Euer Gespräch mit einer Frage oder einer Begrüßung.

Alternativ könnt Ihr die Konversation auch erweitern, indem Ihr Euren Bildschirm oder die Kameraansicht mit Gemini Live teilt. Kurz gesagt ist dies eine Live-Ansicht des „Ask about my“-Bildschirms, in der Ihr Eure Fragen und Konversation auf die auf dem Bildschirm angezeigten Bilder stützen könnt. Um sie zu aktivieren, drückt Ihr einfach auf die Kamera- oder Bildschirmfreigabe-Taste, während Ihr Euch mit Gemini Live unterhältst.

Einen genaueren Blick auf Gemini Live wirft unser Kollege Antoine Engels in seinem Artikel: Mit Googles KI zu sprechen macht Spaß, ist seltsam und ein bisschen sinnlos.

12. Deep Research: Erweiterte KI-Analyse

Deep Research ist eine neuere Funktion in Gemini, die große Datensätze aus dem Internet zusammenfassen und Forschungsberichte erstellen kann. Nutzer/innen können Pläne vor der Erstellung bearbeiten, Berichte verfeinern, Ergebnisse diskutieren und Folgefragen stellen. Deep Research steht jetzt allen Gemini-Nutzer/innen zur Verfügung – ein nützliches Tool für Berufstätige und Studierende gleichermaßen.

Ihr könnt Deep Research nutzen, indem Ihr es im Gemini-Modell auswählt oder im Web auf die Schaltfläche Deep Research tippt. So klappt’s Schritt für Schritt:

Startet Gemini.
Tippt oben auf die KI-Modelle.
Wählt Deep Research.
Beginnt Euren Prompt mit „Erstelle einen Forschungsbericht“ oder „Mache eine Recherche“.
Sobald ein Plan erstellt wird, könnt Ihr ihn anpassen oder mit der Forschung fortfahren.

Wählt das „Deep Research“-Modell aus, wenn Ihr Gemini startet. © nextpit

Mit Eurem Prompt könnt Ihr hier jetzt einen ausführlichen Bericht recherchieren lassen. Vorher bekommt Ihr einen Plan dargelegt, den Ihr auch nochmal bearbeiten könnt. © nextpit

Den resultierenden Text könnt Ihr anschließend wieder exportieren. © nextpit

Am Ende des Berichtes sind die Quellen hinterlegt. © nextpit

Wenn du im Web seid, wähle einfach „Deep Research“ im Eingabefenster.

13. KI-Podcasts aus Dokumenten erstellen

Gemini kann Dokumente und PDFs in podcastähnliche Diskussionen mit KI-generierten Moderatoren über Audio Overview umwandeln.

So erzeugst du eine Audioübersicht aus PDFs und Dateien

Erstelle einen Deep Research Bericht.
Öffne die Deep Research-Datei und tippe auf das Drei-Punkte-Menü.
Scrolle nach unten und wähle Audioübersicht generieren.
Warte, bis der Podcast generiert wird.

14. Gemini steuert Apps von Drittanbietern

Gemini lässt sich in Apps von Drittanbietern wie Spotify und WhatsApp integrieren, so dass die Nutzer/innen Musik abspielen, Nachrichten senden und die Wiedergabe mit Sprachbefehlen steuern können. Sprecht oder schreibt den Befehl einfach an Gemini und sagt der App dabei so genau wie möglichst was Ihr erwartet. Derzeit funktioniert Gemini mit ausgewählten Apps von Drittanbietern, aber es könnten in Zukunft noch mehr hinzukommen.

15. Smarter Search in Google Maps

Gemini ermöglicht auch intelligentere Suchfunktionen in Google Maps. Ihr könnt jetzt nicht nur nach Orten suchen oder Eure Routen planen, sondern auch kontextbezogene Suchen durchführen, wie z. B. „die besten Dinge, die man abends in dieser Stadt tun kann“ oder „die besten Thai-Restaurants“. In den Suchergebnissen werden kuratierte Vorschläge für Orte oder Aktivitäten und zusammengefasste Bewertungen angezeigt. Mit der Funktion „Ask Maps about this place“ könnt Ihr weitere Fragen zu einem Ort stellen.

Diese Funktion ist für Gemini grundsätzlich kostenlos, wird aber noch in verschiedenen Ländern und Regionen ausgerollt.

Mit Gemini könnt Ihr in Google Maps eine kontextbezogene Suche nach Orten oder Aktivitäten starten. © nextpit

Hier bekommt Ihr kuratierte Suchtreffer und Rezensionen – und könnt weitere Fragen prompten. © nextpit

16. Die Stimme von Gemini anpassen

Im Gegensatz zu Google Assistant könnt Ihr bei Gemini die Stimme des Assistenten ändern. Unter Einstellungen > Geminis Stimme könnt Ihr eine männliche oder weibliche Stimme mit verschiedenen Klängen und Akzenten.

Geht in die Einstellungen von Gemini um zu den Einstellungen für die Stimme zu gelangen. © nextpit

Tippt jetzt hier auf die Option für die Sprache von Gemini. © nextpit

Durch hin- und herwischen könnt Ihr die Stimme einstellen. © nextpit

Öffnet Maps und wählt einen Ort aus. Anschließend könnt Ihr Gemini aufrufen und … © nextpit

… per Sprache oder Text Fragen stellen. © nextpit

Die Ergebnisse bekommt Ihr je nach Prompt als Text oder als Vorschlag für eine Aktion, etwa das Starten einer Navigation. © nextpit

Gemini-Versionen im Vergleich: Kostenlos, Premium, Gemini Live

Gemini ist in verschiedenen Versionen erhältlich, die sich je nach Abonnement und Premium-Plan unterscheiden. Die Basisversion ist auf allen kompatiblen Android-Geräten verfügbar, während Premium-Abonnenten Zugang zu leistungsfähigeren Funktionen und schnelleren KI-Modellen haben.

Die Premium-Version von Gemini bietet fortgeschrittene Funktionen wie die Bearbeitung komplexer Aufgaben, Codierung, logisches Denken und die vollständige Integration mit anderen Google-Apps durch Erweiterungen.

Gemini Live, eine weitere Version, ist ein Chatbot, der in die App integriert ist. Es gibt auch eine Premium-Stufe, die erweiterte Funktionen wie Hintergrundgespräche bietet und ihn zu einem intelligenteren KI-Assistenten innerhalb der Gemini-App macht.

Der Gemini Premium (AI Premium) Tarif kostet 19,99 Euro pro Monat. Er beinhaltet den Zugang zu fortschrittlichen KI-Funktionen wie Gemini Ultra 1.0 sowie 2 TB Google One-Speicher und KI-Tools in Gmail, Docs und Sheets. Ihr könnt es einen Monat lang kostenlos bei Google testen.

Habt Ihr Gemini oder Gemini Live schon auf Eurem Gerät ausprobiert? Welches Feature ist Euer Favorit? Lasst es uns bitte in den Kommentaren wissen!

Source link

Verwandte Themen:besten Die erklärt Funktionen Überblick und

Inspohub