Künstliche Intelligenz
Google Echtzeit-Übersetzer: Mehr als Wort zu Wort Übersetzungen
Mitten im Meeting Englisch sprechen, während das Gegenüber die Worte in perfektem Spanisch hört – in Echtzeit. Was lange als Science-Fiction galt, rollt Google nun mit Meet und auf Pixel-Geräten aus. Hinter der Funktion steckt dieselbe KI, die auch Gemini antreibt – und ein komplexes Zusammenspiel spezialisierter Übersetzungsmodelle und generativer Sprach-Module.
Weiterlesen nach der Anzeige
Wir haben mit Googles Director Product Management, Niklas Blum, über die zugrunde liegende Technik gesprochen: Wie funktioniert die End-to-End-Sprachübersetzung, die sogar die Originalstimme erhält? Wie arbietet das internationale Team? Und wo liegen die größten Hürden bei der Übersetzung von gesprochener Sprache?
Mit Google Meet kann jeder in einer anderen Sprache sprechen – in Echtzeit. Das klappt mittels KI, konkret ist es derselbe Übersetzer wie in Gemini. Wie funktioniert das? Was passiert in dem Modell?
Aktuell setzen wir spezialisierte Modelle für die Übersetzung und Gemini für die Sprachgenerierung ein. Diese Architektur setzt auf das AudioLM-Framework sowie Transformer-Blöcke und ist darauf ausgelegt, kontinuierliche Audioströme zu verarbeiten. Das ermöglicht es dem Modell, selbstständig zu entscheiden, wann die Übersetzung ausgegeben wird. Wir haben dazu kürzlich einen technischen Research-Blogpost veröffentlicht, der die Funktionsweise dieser End-to-End Speech-to-Speech Translation (S2ST) unter Beibehaltung der Originalstimme erläutert.

Niklas Blum, Director Product Management bei Google
(Bild: Youtube)
Wie kommt es, dass an dem Echtzeit-Übersetzer ein Team aus Deutschland arbeitet?
Unser Team und unsere Kunden sind global aufgestellt. Die Teams, die an diesem Feature arbeiten, verteilen sich auf Berlin, Stockholm, Zürich, New York und Mountain View. Das Google-Team in Stockholm ist dabei ein zentraler Hub für Googles Echtzeitkommunikation.
Wofür lässt sich der Echtzeit-Übersetzer bisher nutzen? Er ist in Google Meet verfügbar, aber wo kommt er noch zum Einsatz, was ist geplant?
Weiterlesen nach der Anzeige
Die Technologie zur Echtzeit-Übersetzung ist auch auf Pixel-10-Geräten für Anrufe und in Google Translate verfügbar. Bei Google Meet konzentrieren wir uns speziell auf Anwendungsfälle für Echtzeit-Gespräche in Unternehmen, die in verschiedenen Märkten tätig sind und mit Sprachbarrieren zu tun haben. Wir glauben, dass diese Technologie, auch wenn sie noch am Anfang steht, sich rasant weiterentwickeln wird. Echtzeit-Übersetzungen haben das Potenzial, Menschen zu verbinden und Gespräche zu ermöglichen, die so vorher kaum realisierbar waren.
Der Übersetzer ist ein „Lookahead“
Gesprochene Sprache ist fehlerhafter als geschriebene Sprache. Wie geht das Modell damit um? Wird eins zu eins übersetzt, also auch jedes “ähm” und im Zweifelsfall ein abgebrochener Satz? Denn so sprechen wir manchmal ja. Oder zieht der Echtzeit-Übersetzer auch Schlüsse und bereinigt die Sprache quasi?
Unser Modell zur Echtzeit-Übersetzung nutzt Transformer-Blöcke und besteht aus zwei Hauptkomponenten: einem Streaming-Encoder, der die Quell-Audiodaten basierend auf den vorangegangenen zehn Sekunden der Eingabe zusammenfasst, und einem Streaming-Decoder. Letzterer sagt das übersetzte Audio autoregressiv vorher und nutzt dabei den komprimierten Encoder-Status sowie Vorhersagen aus früheren Iterationen.
Die Transformer-Blöcke ermöglichen es dem Modell, selbstständig zu entscheiden, wann die Übersetzung ausgegeben wird. Basierend auf den Trainingsdaten ist das Modell in der Lage, über reine Wort-für-Wort-Übersetzungen hinauszugehen. Das ist besonders hilfreich bei Redewendungen oder dem Erkennen von Eigennamen. Begriffe wie die „Golden Gate Bridge” werden nicht übersetzt.
Was ist die größte Schwierigkeit bei der Übersetzung gesprochener Sprache? Wo hapert es vielleicht auch manchmal noch?
Bei der Übersetzung gesprochener Sprache stehen drei wesentliche Herausforderungen in Konkurrenz zueinander: Wir wollen eine möglichst hohe Übersetzungsqualität, eine minimale Verzögerung und gleichzeitig die originale Stimmcharakteristik beibehalten. Für Echtzeit-Gespräche wird aktuell eine Standardverzögerung von zwei Sekunden genutzt, was für die meisten Sprachen gut funktioniert. Ein längerer „Lookahead“ des Modells würde durch den zusätzlichen Kontext zwar die Übersetzungsqualität verbessern, beeinträchtigt aber das Echtzeit-Erlebnis. Eine optimale Übersetzungsqualität in möglichst kurzer Zeit zu erzielen, bleibt die zentrale Herausforderung und ein Bereich für weitere Verbesserungen.
Generell haben die Fortschritte bei der KI-Audioverarbeitung und der Modellqualität zuletzt große Sprünge gemacht. Das dürfte der Grund sein, weshalb branchenweit eine zunehmende Integration von Sprachübersetzung in verschiedene Produkte stattfindet.
Es gab eine Zeit, da haben Google und auch andere Anbieter ähnliche Übersetzungstools nicht veröffentlicht, weil Missbrauch drohte. Was hat sich geändert?
Wir integrieren diese Funktion nun in unsere Produkte, weil die Technologie einen gewaltigen Sprung nach vorn gemacht hat. Ich glaube, dass es bis vor Kurzem nicht möglich war, wirklich hochwertige dialogorientierte Dienste zu entwickeln, die den erforderlichen Qualitätsstandards entsprechen.
Wie steht es um die Gefahren vor Missbrauch, vor Deepfakes? Welche Schutzmaßnahmen gibt es?
Wir sind natürlich zum Einhalten der geltenden Datenschutzgesetze verpflichtet. Im Laufe der Jahre haben wir eng mit Datenschutzbehörden auf der ganzen Welt zusammengearbeitet und strenge Datenschutzmaßnahmen umgesetzt. So haben wir für Meet klare Richtlinien, wie unser Tool genutzt werden darf. Nutzer:innen ist es beispielsweise nicht gestattet, Meet zu verwenden, um sich als eine andere Person auszugeben.
Technisch gesehen funktioniert die Übersetzungsfunktion ähnlich wie die bestehende Audiokodierung, nur mit der zusätzlichen Funktion der Übersetzung. Jeder Ton, der an das Modell gesendet wird, erzeugt eine Ausgabe. Das Modell arbeitet mit einem 10-Sekunden-Kontextfenster und hat außerhalb dieses Fensters keine semantische Wahrnehmung des gesprochenen Inhalts.
(emw)
Künstliche Intelligenz
Bundesregierung zu Sanktionen: „was offline illegal ist, auch online illegal“
Die Bundesregierung hat Zensur-Vorwürfe der US-Regierung zurückgewiesen und Einreiseverbote gegen die Geschäftsführerinnen der gegen Hass im Internet eintretenden deutschen Beratungsstelle HateAid als inakzeptabel kritisiert. „Nach welchen Regeln wir in Deutschland und in Europa im digitalen Raum leben wollen, wird nicht in Washington entschieden“, erklärte Bundesjustizministerin Stefanie Hubig (SPD) in Berlin.
Weiterlesen nach der Anzeige
Außenminister Johann Wadephul (CDU) nannte die Einreiseverbote nicht akzeptabel. Wadephul schrieb auf der Plattform X, der von der US-Regierung scharf attackierte Digital Services Act (DSA), mit dem Online-Plattformen in der EU reguliert werden, stelle sicher, „dass alles, was offline illegal ist, auch online illegal ist“. Der DSA sei von der Europäischen Union für die EU demokratisch beschlossen worden, er wirke nicht extraterritorial, betonte Wadephul. „Andere Auffassungen wollen wir mit den USA grundsätzlich im transatlantischen Dialog klären, um unsere Partnerschaft zu stärken“, fügte er hinzu.
HateAid spricht von „Akt der Repression“
Die US-Regierung hatte die Einreiseverbote gegen die HateAid-Geschäftsführerinnen Josephine Ballon und Anna-Lena von Hodenberg ebenso wie gegen drei andere Europäer mit angeblicher Zensur von US-Online-Plattformen begründet. Ballon und von Hodenberg sprachen in einer ersten Reaktion von einem „Akt der Repression“. Vom Einreiseverbot ist auch der frühere französische EU-Kommissar Thierry Breton betroffen, der als einer der Architekten des Digital Services Act gilt.
Das Gesetzespaket und dessen praktische Anwendung – im Fall der Plattform X von US-Außenminister Marco Rubio als „Attacke auf alle amerikanischen Tech-Plattformen und das amerikanische Volk durch ausländische Regierungen“ bezeichnet – soll verhindern, dass im Internet ein rechtsfreier Raum entsteht.
Breton verglich die US-Sanktionen mit der „Hexenjagd“ auf vermeintliche Kommunisten zu Zeiten der berüchtigten McCarthy-Ära in den USA, in der viele Menschen zu Unrecht ins Visier der Staatsgewalt gerieten. Auf der Plattform X schrieb er: „An unsere amerikanischen Freunde: Die Zensur findet nicht dort statt, wo ihr sie wähnt.“
US-Regierung sind EU-Digitalgesetze ein Dorn im Auge
Die US-Regierung fordert seit längerem Änderungen an den strengen EU-Digitalgesetzen, die zum Beispiel die Verbreitung von Falschinformationen über Plattformen wie X verhindern sollen und auch Unternehmen wie Amazon, Apple und Meta (Facebook), Alphabet (Google) und Microsoft betreffen. Die EU-Kommission betont immer wieder, dass diese nur einen fairen Wettbewerb und den Schutz von Kindern und demokratischen Wahlen garantieren sollen.
Weiterlesen nach der Anzeige
Vorwürfe, dass etwa das Gesetz über digitale Dienste (DSA) der EU ein Zensurinstrument sei, hätten keinerlei Grundlage. Konkret verpflichtet es Plattformen beispielsweise dazu, einfache Verfahren zum Melden illegaler Inhalte, Waren oder Dienstleistungen anzubieten. Zudem müssen sie Maßnahmen ergreifen, um Minderjährige vor Glücksspielen oder Pornografie zu schützen.
Französischer Außenminister: Völker Europas sind frei und souverän
Sowohl Breton als auch die französische Regierung erinnerten daran, dass der Digital Services Act vom EU-Parlament und allen Mitgliedstaaten mit großer demokratischer Mehrheit beschlossen worden sei. Frankreichs Außenminister Jean-Noël Barrot schrieb auf X: „Die Völker Europas sind frei und souverän und lassen sich von anderen keine Regeln für ihren digitalen Raum aufzwingen.“ Er betonte, das europäische Gesetz finde in den USA gar keine Anwendung.
Ministerium: Förderung von HateAid, aber kein Einfluss
Die deutsche Justizministerin Hubig erklärte in Berlin, HateAid unterstütze Betroffene von rechtswidriger digitaler Hassrede, verbiete aber selbst keine Meinungsäußerungen. Die Organisation leiste einen wichtigen Beitrag dazu, dass Persönlichkeitsrechte auch im digitalen Raum geschützt würden. „Wer das als Zensur bezeichnet, stellt unser rechtsstaatliches System falsch dar.“
Das deutsche Ministerium der Justiz und für Verbraucherschutz fördert nach eigenen Angaben seit 2020 eine Beratung durch HateAid für Betroffene von digitaler Gewalt. Die Entscheidung, ob und in welcher Höhe Organisationen gefördert werden, treffe final der Haushaltsgesetzgeber, also der Bundestag. Das Ministerium habe auf die Geschäftsführung von HateAid keinen Einfluss.
Nouripour fordert Einbestellung des US-Geschäftsträgers
Bundestags-Vizepräsident Omid Nouripour forderte die umgehende Einbestellung des Geschäftsträgers der US-Botschaft in Deutschland, Alan Meltzer. „Hier geht es um den Schutz deutscher Staatsbürger“, sagte der Grünen-Politiker. Die förmliche Einbestellung gilt als scharfes diplomatisches Mittel, mit dem die Regierung des Gastlandes eine deutliche Verstimmung signalisiert. Nachdem die US-Regierung noch keinen Botschafter für Deutschland bestellt hat, ist Meltzer oberster US-Vertreter in Berlin.
Die stellvertretende SPD-Fraktionsvorsitzende Sonja Eichwede nannte das Vorgehen der USA inakzeptabel. „Unter dem Deckmantel einer vermeintlichen Meinungsfreiheit versucht die USA gegen Menschen und Organisationen vorzugehen, die sich für soziale Plattformen ohne Hass und Hetze einsetzen.“
HateAid: USA stellen Europas Souveränität in Frage
Die HateAid-Geschäftsführerinnen Ballon und von Hodenberg erklärten auf dpa-Anfrage zum Einreiseverbot: „Wir sind nicht überrascht. Es ist ein Akt der Repression einer Regierung, die zunehmend Rechtsstaatlichkeit missachtet und versucht, ihre Kritiker mit aller Härte zum Schweigen zu bringen.“ Die US-Regierung versuche mit allen Mitteln zu verhindern, dass sich US-Konzerne in Europa an geltendes Recht halten müssten, und stelle damit „die europäische Souveränität infrage“. Damit sei eine neue Eskalationsstufe erreicht.
HateAid bietet psychologische und rechtliche Unterstützung für Menschen an, die im Internet diskriminiert, beleidigt, bedroht oder angegriffen werden. Im Oktober wurde von Hodenberg für ihre Arbeit mit dem Bundesverdienstorden ausgezeichnet. Damals hieß es, sie habe 2018 mit der Gründung von HateAid Pionierarbeit geleistet und die erste bundesweite Beratungsstelle geschaffen, an die sich Menschen bei Fällen von Gewalt im Netz wenden können.
US-Regierung nimmt Musk-Kritiker ins Visier
Sanktionen verhängte die US-Regierung auch gegen die Gründerin des britischen Global Disinformation Index (GDI), Clare Melford, und den Gründer des in den USA und Großbritannien tätigen Center for Countering Digital Hate (CCDH), Imran Ahmed. Der Brite lebt der Organisation zufolge in Washington, ihm droht nun die Abschiebung aus den USA. Beide setzen sich gegen Hass und Desinformation im Internet ein. X-Eigentümer Elon Musk hatte das Center for Countering Digital Hate als „kriminelle Organisation“ bezeichnet.
Lesen Sie auch
(nie)
Künstliche Intelligenz
iX-Workshop: RAG-Systeme effizient evaluieren und optimieren
Ein RAG-System (Retrieval-Augmented Generation) kombiniert eine Suchmaschine mit einem Sprachmodell: Es findet zuerst relevante Texte und nutzt sie dann, um eine passende Antwort zu formulieren. So kann die KI auf externes Wissen zugreifen und präzisere Ergebnisse liefern.
Weiterlesen nach der Anzeige
In dem zweitägigen Intensiv-Workshop RAG-Systeme systematisch evaluieren und optimieren lernen Sie, wie Sie RAG-Systeme systematisch bewerten, Schwächen identifizieren und durch den Einsatz moderner Frameworks wie RAGAS fundierte Leistungsanalysen durchführen. Sie lernen fortgeschrittene Techniken wie Semantic Chunking, Hybrid Search, Query Expansion und Reranking kennen und wenden diese direkt in praktischen Übungen an, um Genauigkeit, Relevanz und Effizienz Ihrer RAG-Anwendungen nachhaltig zu verbessern.
Jede Menge Praxis mit echten Anwendungsfällen
Die Schulung ist interaktiv aufgebaut, mit hohem Praxisanteil und intensiver Betreuung durch zwei erfahrene Trainer. In kleinen Teams oder Zweiergruppen arbeiten Sie an realitätsnahen Use Cases und entwickeln eigenständig Lösungsstrategien für typische Herausforderungen in produktionsnahen Szenarien. So erleben Sie unmittelbar die Wirkung verschiedener Optimierungsansätze und lernen, diese gezielt zu kombinieren.
|
Februar 12.02. – 13.02.2026 |
Online-Workshop, 09:00 – 17:00 Uhr 10 % Frühbucher-Rabatt bis zum 15. Jan. 2026 |
|
Juni 18.06. – 19.06.2026 |
Online-Workshop, 09:00 – 17:00 Uhr 10 % Frühbucher-Rabatt bis zum 21. Mai 2026 |
|
August 20.08. – 21.08.2026 |
Online-Workshop, 09:00 – 17:00 Uhr 10 % Frühbucher-Rabatt bis zum 23. Jul. 2026 |
Angesprochen sind Softwareentwickler und AI-Engineers, die mit RAG vertraut sind und ihre Systeme in Bezug auf Leistung, Relevanz und Robustheit systematisch weiterentwickeln möchten.
Die Softwareentwickler Steve Haupt und Lilli Huss von andrena objects leiten den Workshop. Steve Haupt hat sich auf KI-Themen spezialisiert, eigene KI-Anwendungen entwickelt, zahlreiche Vorträge zu Künstlicher Intelligenz gehalten und mehrere KI-Trainings konzipiert. Lilli Huss hingegen legt ihren Fokus auf Clean Code, testgetriebene Entwicklung und den praktischen Einsatz generativer KI.

(ilk)
Künstliche Intelligenz
KI-Kontroverse: „Clair Obscur – Expedition 33“ verliert Preis „Spiel des Jahres“
Die Indie Game Awards entziehen dem Rundentaktik-Rollenspiel „Clair Obscur – Expedition 33“ nachträglich den Preis für das beste Spiel des Jahres 2025 (Game of the Year, GOTY). Den erhielt das französische Studio Sandfall Interactive erst Mitte Dezember für sein Erstlingswerk. Grund ist eine Kontroverse um den Einsatz Künstlicher Intelligenz (KI).
Weiterlesen nach der Anzeige
Die Indie Game Awards erlauben nur Nominierungen für Spiele, die ohne KI-Werkzeuge entstanden sind. Im Bewerbungsprozess gibt es allerdings offenbar keine Prüfung. Die Entwickler müssen lediglich versichern, keine KI eingesetzt zu haben. Das soll laut Mitteilung der Indie Game Awards auch ein Vertreter Sandfall Interactives getan haben.
Jedoch war schon im April 2025 klar, dass das technisch nicht ganz stimmt: Spieler entdeckten eine Litfaßsäule mit unleserlichem Kauderwelsch, den offenbar eine KI erstellt hatte. Sandfall Interactive ersetzte die betroffenen Texturen innerhalb der ersten Woche nach Spielveröffentlichung.
„Ein bisschen KI“
In einem damaligen Interview mit dem spanischen Magazin El País erklärte Produzent François Meurisse: „Wir nutzen ein bisschen KI, aber nicht viel.“ Im Anschluss des Interviews reichte Sandfall eine Ausführung mit mehr Details nach.
Demnach hätten einige Entwickler intern „kurz mit KI-Tools herumexperimentiert, um vorübergehende Platzhalter-Texturen zu erstellen“. Weiter hieß es: „Nach der Veröffentlichung wurden Instanzen einer Platzhaltertextur innerhalb von fünf Tagen entfernt und durch die korrekten Texturen ersetzt, die ursprünglich für die Veröffentlichung vorgesehen waren, aber während des Qualitätssicherungsprozesses übersehen worden waren.“ Die Verantwortlichen der Indie Game Awards haben laut eigener Aussage am Tage der diesjährigen Award-Verleihung von dem Interview erfahren.
Jetzt erhält das Spiel mit den zuvor zweitmeisten Stimmen die Auszeichnung als Spiel des Jahres 2025: das Puzzle-Adventure-Spiel „Blue Prince“ von Entwickler Dogubomb. „Clair Obscur – Expedition 33“ verliert außerdem den Debut Game Award, der stattdessen an das Survival-Horror-Spiel „Sorry We’re Closed“ von A la Mode Games geht.
Weiterlesen nach der Anzeige
(mma)
-
UX/UI & Webdesignvor 2 MonatenIllustrierte Reise nach New York City › PAGE online
-
Künstliche Intelligenzvor 2 MonatenAus Softwarefehlern lernen – Teil 3: Eine Marssonde gerät außer Kontrolle
-
Künstliche Intelligenzvor 2 Monaten
Top 10: Die beste kabellose Überwachungskamera im Test
-
UX/UI & Webdesignvor 2 MonatenSK Rapid Wien erneuert visuelle Identität
-
Künstliche Intelligenzvor 2 MonatenNeue PC-Spiele im November 2025: „Anno 117: Pax Romana“
-
Entwicklung & Codevor 1 MonatKommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac
-
Künstliche Intelligenzvor 2 MonatenDonnerstag: Deutsches Flugtaxi-Start-up am Ende, KI-Rechenzentren mit ARM-Chips
-
UX/UI & Webdesignvor 2 MonatenArndt Benedikt rebranded GreatVita › PAGE online
