Künstliche Intelligenz
Google kündigt „Gemini 3.5 Live Translate“ für Echtzeit-Übersetzung an
Google arbeitet seit Jahren an der Echtzeit-Übersetzung, um damit Sprachbarrieren zu überwinden. Mit „Gemini 3.5 Live Translate“ will Google diesem Ziel näher gekommen sein. Das neue KI-Modell wird weltweit in der Übersetzungs-App für Android und iOS eingeführt – erste Nutzer haben es bereits. Auch in Google Meet soll es einziehen.
Weiterlesen nach der Anzeige
Automatische Erkennung von 70 Sprachen
Laut der Ankündigung soll „Gemini 3.5 Live Translate“, ein Familienmitglied der Gemini-3.5-Reihe, die Google im Zuge der I/O angekündigt hat, in der Lage sein, über 70 Sprachen automatisch zu erkennen. Es könne außerdem natürlich klingende Übersetzungen erstellen, die die Intonation, das Sprechtempo und die Stimmlage des Sprechers beibehalten. Ferner kann es Google zufolge kontinuierlich übersetzte Sprache generieren, während andere Systeme oftmals auf den Abschluss eines Sprechers warten.
Gemini 3.5 Live Translate wird zum einen weltweit in der Übersetzungs-App für Android und iOS verfügbar sein. Für Android führt der Konzern zum anderen einen neuen „Hörmodus“ ein. Neben der Möglichkeit, Echtzeit-Übersetzungen über Kopfhörer zu hören, bietet der Modus auch die Option, Übersetzungen direkt über die Hörmuschel des Smartphones zu hören.
Google Meet
„Gemini 3.5 Live Translate“ wird laut Google außerdem in Google Meet integriert. Sobald die Funktion verfügbar ist, soll sie in der Anwendung Support für mehr als 70 Sprachen bieten – bislang stehen in Meet nur fünf Sprachen zur Wahl. Laut Google sind damit über 2000 Sprachkombinationen in einem Meeting möglich. Bisher funktionierte die Sprachübersetzung in Meet nur vom und ins Englische. Ferner arbeite Google an der Überarbeitung der Bedienoberfläche von Meet, damit Nutzerinnen und Nutzer schneller auf die Sprachübersetzung zugreifen können.
Die neue Version der Sprachübersetzung in Meet werde zunächst als private Vorschau für ausgewählte Google-Workspace-Geschäftskunden eingeführt. Die Einführung ist für einen noch nicht festgelegten Zeitpunkt im Laufe dieses Monats geplant, im Laufe des Jahres soll sie weiteren Nutzern zur Verfügung gestellt werden. Entwickler erhalten Zugriff auf die neue Gemini-Version als Public Preview über die Gemini Live API und Google AI Studio.
Weiterlesen nach der Anzeige
Wie bei anderen von Google KI-generierten Inhalten soll auch das von Gemini 3.5 Live Translate erzeugte Audio mit einem SynthID-Wasserzeichen versehen werden. Dabei handelt es sich um ein digitales Wasserzeichen.
Lesen Sie auch
(afl)