Apps & Mobile Entwicklung

Die besten Funktionen erklärt und im Überblick


Was ist Gemini?

Wenn Ihr ein Android-Smartphone oder -Tablet benutzt, habt Ihr Gemini wahrscheinlich schon kennengelernt. Aber wenn Ihr mit diesem neuen KI-Assistenten noch nicht ganz vertraut seid, hier ein kurzer Überblick.

Gemini ist der neue KI-Assistent von Google, der den Google Assistant bei Sprachabfragen, Befehlen und Aufgaben ersetzen soll. Noch sind nicht alle Funktionen und Erweiterungen ausgerollt, aber im Laufe der Zeit werden weitere Updates eingeführt.

Gemini zeichnet sich durch seine fortschrittlichen KI-Fähigkeiten aus, die ihn im Vergleich zum Google Assistant konversationeller und natürlicher in der Interaktion mit den Nutzern machen.

Die wichtigsten Funktionen von Gemini

Jetzt, wo Ihr mit den verschiedenen Versionen vertraut seid, wollen wir uns die wichtigsten Funktionen von Gemini ansehen.

1. Multimodale KI für Bild, Text & mehr

Einer der größten Vorteile von Gemini sind seine multimodalen Fähigkeiten. Während Google Assistant Sprach-, Text- und Bildeingaben unterstützt, geht Gemini noch einen Schritt weiter und ermöglicht es Nutzern, mit Videos, Code und sogar Dateien zu interagieren. Der smarte KI-Chatbot kann sich mit Gemini Live auch in Echtzeit an Konversationen beteiligen und neben Text auch Bilder und Videos ausgeben.

Gemini unterstützt verschiedene Eingabearten, was ihn zu einem vielseitigen KI-Assistenten macht:

  • Text
  • Dateien oder Dokumente
  • Bilder
  • Video
  • Audio
  • Code

Nutzt das! Oft ist es viel einfacher, Gemini ein Foto oder ein kurzes Video zu schicken als eine Situation ausführlich zu beschreiben.

2. Bilder generieren

Gemini enthält ein Tool zur Generierung von Bildern aus Text, das sowohl in der kostenlosen als auch in der Premium-Version verfügbar ist. Die Premium-Version kann komplexere Bilder erstellen, z. B. Porträts von Menschen. Sie verwendet das neueste Imagen-3-Modell von Google, das eine verbesserte Bildqualität und Anpassungsmöglichkeiten bietet.

So benutzt Ihr den Bildgenerator:

  1. Öffnet die Gemini-App auf Eurem Gerät.
  2. Tippt oder sprecht Eure Eingabeaufforderung, beginnend mit „erstelle“, „generiere“ oder „zeichne“.
  3. Legt Stile, Farben und Beschreibungen fest.
  4. Tippt auf den Senden-Button und wartet auf das Ergebnis.

Ihr könnt Eure Eingabeaufforderungen für bessere Ergebnisse verfeinern und die Bilder direkt in der App speichern oder teilen. Weitere Informationen zu diesem Thema findet Ihr in unserem Leitfaden zum Erstellen und Speichern von KI-Bildern mit Gemini.

3. Texte und Videos zusammenfassen

Gemini kann lange Texte, E-Mails, Dokumente und YouTube-Videos zusammenfassen. Um diese Funktion zu nutzen, müsst Ihr die Google Workspace und YouTube Erweiterungen in der App aktivieren.

So fasst Ihr Texte zusammen:

  1. Öffnet die Gemini App.
  2. Fügt den Text oder die URL in das Eingabefeld ein oder tippt sie ein.
  3. Drückt auf den Senden-Button und erhaltet die Zusammenfassung.

So fasst Ihr YouTube-Videos (mit aktivierten Untertiteln) zusammen:

  1. Öffnet das YouTube-Video.
  2. Startet oder ruft Gemini auf.
  3. Tippt oder sprecht: „Dieses Video zusammenfassen“.

Gemini kann auch wichtige Informationen wie Rezepte oder Menüs aus den Videountertiteln extrahieren. Mehr dazu erfahrt Ihr in unserem Tutorial, in dem wir erklären, wie Ihr mit Gemini YouTube-Videos zusammenfasst.

4. Fragt nach, was auf dem Bildschirm zu sehen ist

Eine der nützlichsten Funktionen von Gemini sind die kontextbezogenen Infos via „Ask About Screen“. Damit könnt Ihr Erklärungen und Einblicke zu Bildern und Webseiten erhalten – so wie Google Lens, nur mit zusätzlichen KI-Funktionen.

So nutzt Ihr „Ask About Screen“

  1. Öffnet ein Bild oder eine Webseite (oder nehmt ein neues Foto auf).
  2. Startet Gemini über eine Geste oder einen Shortcut.
  3. Tippt auf „Ask about Screen“ (es wird ein Screenshot gemacht und hochgeladen).
  4. Tippt oder sprecht Eure Frage über den Inhalt.
  5. Drückt auf Senden.

Ihr könnt auch manuell ein Foto zur Analyse in die Gemini-App hochladen oder Text aus Webseiten extrahieren, um ihn zusammenzufassen, zu erklären oder zu übersetzen.

5. Nach PDF-Dateien fragen

Die Funktion „Ask About PDF“ funktioniert ähnlich wie „Ask About Screen“, konzentriert sich aber auf PDF-Dokumente. Ihr könnt Texte zusammenfassen, extrahieren oder nach bestimmten Daten in einer Datei suchen. Diese Funktion ist ideal, um schnell wichtige Informationen aus langen Dokumenten zu extrahieren.

Während diese Funktion in der Basis- und der Premium-Version von Gemini verfügbar ist, könnt ihr in der Pro-Version komplexere und größere PDF-Dateien mit einem leistungsfähigeren Modell bearbeiten.

So benutzt Ihr Ask About PDF

  1. Startet die Google Files App.
  2. Öffnet ein PDF-Dokument.
  3. Startet Gemini per Geste und tippt dann auf Ask about PDF.
  4. Wartet, bis die Datei hochgeladen ist.
  5. Gebt Eure Anfrage ein und tippt dann auf Senden.

6. Gemini mit Gmail und Kalender verwenden

Gemini lässt sich nahtlos in Google-Apps integrieren und erleichtert so die Aufgabenverwaltung. Es kann zum Beispiel Flugdetails aus Gmail extrahieren und sie als Ereignisse im Google Kalender hinzufügen.

So verwendet Ihr Gemini für Kalenderereignisse

  1. Bittet Gemini, Flugdetails oder Flugpläne aus Google Mail abzurufen.
  2. Fügt Ereignisse direkt im Google Kalender hinzu oder ändert sie, indem Ihr im Kalender auf Weiter tippt.

Gemini kann auch Termine in E-Mails erkennen, die gerade im Web verfügbar sind, damit Ihr sie schnell zu Eurem Kalender hinzufügen könnt.

7. Analysen und Erstellen von Visualisierungen

Gemini kann Daten aus Tabellenkalkulationen, Folien und Dokumenten analysieren und sie in einer leicht verdaulichen Präsentation visualisieren oder die interessantesten Erkenntnisse und Muster über Bilder oder interaktive Diagramme über Canvas bereitstellen.

So erstellt Ihr visuelle Diagramme und Tabellen mit Gemini

  1. Startet Gemini.
  2. Tippt auf die Schaltfläche + und wählt Dateien.
  3. Ladet Eure Tabelle hoch (Excel, Sheets oder CSV).
  4. Beginnt Euren Prompt mit „Visualisiere …“ oder „Erstelle ein (Balken-)Diagramm aus den folgenden Daten“.

8. Code für interaktive und kollaborative Visualisierungen über Canvas erhalten

Mit der Canvas-Funktion in Gemini könnt Ihr umfangreichere und interaktive Inhalte wie Infografiken, Quizze und Apps in einem Dokument oder einem Code erstellen. Sie ist sowohl für kostenlose als auch für kostenpflichtige Gemini-Apps verfügbar. Kostenpflichtige Nutzer/innen erhalten Zugang zum neuesten und leistungsfähigeren Gemini-Modell, das eine verbesserte Leistung hat und größere Projekte bearbeiten kann.

So benutzt Ihr Canvas:

  1. Startet Gemini.
  2. Tippt auf die Schaltfläche „Mehr“ (oft ein „+“-Symbol) in der Eingabeaufforderungsleiste und wählt Canvas.
  3. Gebt Euren Prompt ein, um das Dokument, den Code oder den interaktiven Inhalt zu beschreiben, den Ihr erstellen möchtet. Ihr könnt auch unterstützte Dateien (wie PDFs oder Bilder) hochladen, um Euren Prompt zu beschreiben.
  4. Wartet darauf, dass der Inhalt generiert ist.

Bei Dokumenttypen könnt Ihr die Datei ansehen oder herunterladen. Den Code könnt Ihr sowohl im Web als auch auf mobilen Plattformen direkt in Canvas in der Vorschau anzeigen lassen, und es gibt Optionen zum Teilen und Bearbeiten des Codes.

9. Verwendet Gemini auf dem Sperrbildschirm

Gemini übernimmt die Funktionen des Google Assistant auf dem Sperrbildschirm, wie z. B. das Einstellen eines Weckers oder eines Kalenderereignisses, das Lesen von Benachrichtigungen oder das Beantworten von Anrufen, sodass Nutzer/innen Aufgaben ausführen können, ohne ihr Gerät zu entsperren.

So aktiviert Ihr Gemini auf dem Sperrbildschirm

  1. Öffnet die Gemini-App.
  2. Tippt auf Euer Profilbild.
  3. Geht zu Einstellungen > Gemini auf dem Sperrbildschirm.
  4. Aktiviert Gemini ohne Entsperrung verwenden.
  5. Schaltet Anrufe tätigen und Nachrichten senden ohne Entsperren ein.

10. Smart Home-Geräte mit Gemini steuern

Wie Google Assistant kann auch Gemini Smart Home-Geräte steuern. Ihr müsst Eure Geräte in der Google Home App hinzufügen und Drittanbieter-Apps wie Xiaomi Mi Home oder Samsung SmartThings verknüpfen.

Hier ist ein Beispiel, wie Ihr einen smarten Luftreiniger steuert:

  1. Fügt Euer Smart Home-Gerät in der Home-App hinzu.
  2. Startet Gemini.
  3. Schreibt oder sprecht den Befehl und gebt dabei den Gerätenamen und die Aktion an.
  4. Tippt auf Senden.

11. Chattet und teilt Eure Kamera mit Gemini Live

Gemini Live bietet natürliche, kontinuierliche Unterhaltungen. Die kostenlose Version bietet fast die gleichen Funktionen wie die Premium-Version, wobei letztere tiefere Interaktionen ermöglicht, einschließlich Gesprächsprotokollen zum späteren Nachschlagen. Folgt der Anleitung, um Gemini Live zu nutzen.

  1. Startet Gemini.
  2. Tippt auf die Schaltfläche Gemini Live.
  3. Beginnt Euer Gespräch mit einer Frage oder einer Begrüßung.

Alternativ könnt Ihr die Konversation auch erweitern, indem Ihr Euren Bildschirm oder die Kameraansicht mit Gemini Live teilt. Kurz gesagt ist dies eine Live-Ansicht des „Ask about my“-Bildschirms, in der Ihr Eure Fragen und Konversation auf die auf dem Bildschirm angezeigten Bilder stützen könnt. Um sie zu aktivieren, drückt Ihr einfach auf die Kamera- oder Bildschirmfreigabe-Taste, während Ihr Euch mit Gemini Live unterhältst.

Einen genaueren Blick auf Gemini Live wirft unser Kollege Antoine Engels in seinem Artikel: Mit Googles KI zu sprechen macht Spaß, ist seltsam und ein bisschen sinnlos.

12. Deep Research: Erweiterte KI-Analyse

Deep Research ist eine neuere Funktion in Gemini, die große Datensätze aus dem Internet zusammenfassen und Forschungsberichte erstellen kann. Nutzer/innen können Pläne vor der Erstellung bearbeiten, Berichte verfeinern, Ergebnisse diskutieren und Folgefragen stellen. Deep Research steht jetzt allen Gemini-Nutzer/innen zur Verfügung – ein nützliches Tool für Berufstätige und Studierende gleichermaßen.

Ihr könnt Deep Research nutzen, indem Ihr es im Gemini-Modell auswählt oder im Web auf die Schaltfläche Deep Research tippt. So klappt’s Schritt für Schritt:

  1. Startet Gemini.
  2. Tippt oben auf die KI-Modelle.
  3. Wählt Deep Research.
  4. Beginnt Euren Prompt mit „Erstelle einen Forschungsbericht“ oder „Mache eine Recherche“.
  5. Sobald ein Plan erstellt wird, könnt Ihr ihn anpassen oder mit der Forschung fortfahren.

Wenn du im Web seid, wähle einfach „Deep Research“ im Eingabefenster.

13. KI-Podcasts aus Dokumenten erstellen

Gemini kann Dokumente und PDFs in podcastähnliche Diskussionen mit KI-generierten Moderatoren über Audio Overview umwandeln.

So erzeugst du eine Audioübersicht aus PDFs und Dateien

  1. Erstelle einen Deep Research Bericht.
  2. Öffne die Deep Research-Datei und tippe auf das Drei-Punkte-Menü.
  3. Scrolle nach unten und wähle Audioübersicht generieren.
  4. Warte, bis der Podcast generiert wird.

14. Gemini steuert Apps von Drittanbietern

Gemini lässt sich in Apps von Drittanbietern wie Spotify und WhatsApp integrieren, so dass die Nutzer/innen Musik abspielen, Nachrichten senden und die Wiedergabe mit Sprachbefehlen steuern können. Sprecht oder schreibt den Befehl einfach an Gemini und sagt der App dabei so genau wie möglichst was Ihr erwartet. Derzeit funktioniert Gemini mit ausgewählten Apps von Drittanbietern, aber es könnten in Zukunft noch mehr hinzukommen.

15. Smarter Search in Google Maps

Gemini ermöglicht auch intelligentere Suchfunktionen in Google Maps. Ihr könnt jetzt nicht nur nach Orten suchen oder Eure Routen planen, sondern auch kontextbezogene Suchen durchführen, wie z. B. „die besten Dinge, die man abends in dieser Stadt tun kann“ oder „die besten Thai-Restaurants“. In den Suchergebnissen werden kuratierte Vorschläge für Orte oder Aktivitäten und zusammengefasste Bewertungen angezeigt. Mit der Funktion „Ask Maps about this place“ könnt Ihr weitere Fragen zu einem Ort stellen.

Diese Funktion ist für Gemini grundsätzlich kostenlos, wird aber noch in verschiedenen Ländern und Regionen ausgerollt.

16. Die Stimme von Gemini anpassen

Im Gegensatz zu Google Assistant könnt Ihr bei Gemini die Stimme des Assistenten ändern. Unter Einstellungen > Geminis Stimme könnt Ihr eine männliche oder weibliche Stimme mit verschiedenen Klängen und Akzenten.

Gemini-Versionen im Vergleich: Kostenlos, Premium, Gemini Live

Gemini ist in verschiedenen Versionen erhältlich, die sich je nach Abonnement und Premium-Plan unterscheiden. Die Basisversion ist auf allen kompatiblen Android-Geräten verfügbar, während Premium-Abonnenten Zugang zu leistungsfähigeren Funktionen und schnelleren KI-Modellen haben.

Die Premium-Version von Gemini bietet fortgeschrittene Funktionen wie die Bearbeitung komplexer Aufgaben, Codierung, logisches Denken und die vollständige Integration mit anderen Google-Apps durch Erweiterungen.

Gemini Live, eine weitere Version, ist ein Chatbot, der in die App integriert ist. Es gibt auch eine Premium-Stufe, die erweiterte Funktionen wie Hintergrundgespräche bietet und ihn zu einem intelligenteren KI-Assistenten innerhalb der Gemini-App macht.

Der Gemini Premium (AI Premium) Tarif kostet 19,99 Euro pro Monat. Er beinhaltet den Zugang zu fortschrittlichen KI-Funktionen wie Gemini Ultra 1.0 sowie 2 TB Google One-Speicher und KI-Tools in Gmail, Docs und Sheets. Ihr könnt es einen Monat lang kostenlos bei Google testen.


Habt Ihr Gemini oder Gemini Live schon auf Eurem Gerät ausprobiert? Welches Feature ist Euer Favorit? Lasst es uns bitte in den Kommentaren wissen!



Source link

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Beliebt

Die mobile Version verlassen