Künstliche Intelligenz
Google Echtzeit-Übersetzer: Mehr als Wort zu Wort Übersetzungen
Mitten im Meeting Englisch sprechen, während das Gegenüber die Worte in perfektem Spanisch hört – in Echtzeit. Was lange als Science-Fiction galt, rollt Google nun mit Meet und auf Pixel-Geräten aus. Hinter der Funktion steckt dieselbe KI, die auch Gemini antreibt – und ein komplexes Zusammenspiel spezialisierter Übersetzungsmodelle und generativer Sprach-Module.
Weiterlesen nach der Anzeige
Wir haben mit Googles Director Product Management, Niklas Blum, über die zugrunde liegende Technik gesprochen: Wie funktioniert die End-to-End-Sprachübersetzung, die sogar die Originalstimme erhält? Wie arbietet das internationale Team? Und wo liegen die größten Hürden bei der Übersetzung von gesprochener Sprache?
Mit Google Meet kann jeder in einer anderen Sprache sprechen – in Echtzeit. Das klappt mittels KI, konkret ist es derselbe Übersetzer wie in Gemini. Wie funktioniert das? Was passiert in dem Modell?
Aktuell setzen wir spezialisierte Modelle für die Übersetzung und Gemini für die Sprachgenerierung ein. Diese Architektur setzt auf das AudioLM-Framework sowie Transformer-Blöcke und ist darauf ausgelegt, kontinuierliche Audioströme zu verarbeiten. Das ermöglicht es dem Modell, selbstständig zu entscheiden, wann die Übersetzung ausgegeben wird. Wir haben dazu kürzlich einen technischen Research-Blogpost veröffentlicht, der die Funktionsweise dieser End-to-End Speech-to-Speech Translation (S2ST) unter Beibehaltung der Originalstimme erläutert.

Niklas Blum, Director Product Management bei Google
(Bild: Youtube)
Wie kommt es, dass an dem Echtzeit-Übersetzer ein Team aus Deutschland arbeitet?
Unser Team und unsere Kunden sind global aufgestellt. Die Teams, die an diesem Feature arbeiten, verteilen sich auf Berlin, Stockholm, Zürich, New York und Mountain View. Das Google-Team in Stockholm ist dabei ein zentraler Hub für Googles Echtzeitkommunikation.
Wofür lässt sich der Echtzeit-Übersetzer bisher nutzen? Er ist in Google Meet verfügbar, aber wo kommt er noch zum Einsatz, was ist geplant?
Weiterlesen nach der Anzeige
Die Technologie zur Echtzeit-Übersetzung ist auch auf Pixel-10-Geräten für Anrufe und in Google Translate verfügbar. Bei Google Meet konzentrieren wir uns speziell auf Anwendungsfälle für Echtzeit-Gespräche in Unternehmen, die in verschiedenen Märkten tätig sind und mit Sprachbarrieren zu tun haben. Wir glauben, dass diese Technologie, auch wenn sie noch am Anfang steht, sich rasant weiterentwickeln wird. Echtzeit-Übersetzungen haben das Potenzial, Menschen zu verbinden und Gespräche zu ermöglichen, die so vorher kaum realisierbar waren.
Der Übersetzer ist ein „Lookahead“
Gesprochene Sprache ist fehlerhafter als geschriebene Sprache. Wie geht das Modell damit um? Wird eins zu eins übersetzt, also auch jedes “ähm” und im Zweifelsfall ein abgebrochener Satz? Denn so sprechen wir manchmal ja. Oder zieht der Echtzeit-Übersetzer auch Schlüsse und bereinigt die Sprache quasi?
Unser Modell zur Echtzeit-Übersetzung nutzt Transformer-Blöcke und besteht aus zwei Hauptkomponenten: einem Streaming-Encoder, der die Quell-Audiodaten basierend auf den vorangegangenen zehn Sekunden der Eingabe zusammenfasst, und einem Streaming-Decoder. Letzterer sagt das übersetzte Audio autoregressiv vorher und nutzt dabei den komprimierten Encoder-Status sowie Vorhersagen aus früheren Iterationen.
Die Transformer-Blöcke ermöglichen es dem Modell, selbstständig zu entscheiden, wann die Übersetzung ausgegeben wird. Basierend auf den Trainingsdaten ist das Modell in der Lage, über reine Wort-für-Wort-Übersetzungen hinauszugehen. Das ist besonders hilfreich bei Redewendungen oder dem Erkennen von Eigennamen. Begriffe wie die „Golden Gate Bridge” werden nicht übersetzt.
Was ist die größte Schwierigkeit bei der Übersetzung gesprochener Sprache? Wo hapert es vielleicht auch manchmal noch?
Bei der Übersetzung gesprochener Sprache stehen drei wesentliche Herausforderungen in Konkurrenz zueinander: Wir wollen eine möglichst hohe Übersetzungsqualität, eine minimale Verzögerung und gleichzeitig die originale Stimmcharakteristik beibehalten. Für Echtzeit-Gespräche wird aktuell eine Standardverzögerung von zwei Sekunden genutzt, was für die meisten Sprachen gut funktioniert. Ein längerer „Lookahead“ des Modells würde durch den zusätzlichen Kontext zwar die Übersetzungsqualität verbessern, beeinträchtigt aber das Echtzeit-Erlebnis. Eine optimale Übersetzungsqualität in möglichst kurzer Zeit zu erzielen, bleibt die zentrale Herausforderung und ein Bereich für weitere Verbesserungen.
Generell haben die Fortschritte bei der KI-Audioverarbeitung und der Modellqualität zuletzt große Sprünge gemacht. Das dürfte der Grund sein, weshalb branchenweit eine zunehmende Integration von Sprachübersetzung in verschiedene Produkte stattfindet.
Es gab eine Zeit, da haben Google und auch andere Anbieter ähnliche Übersetzungstools nicht veröffentlicht, weil Missbrauch drohte. Was hat sich geändert?
Wir integrieren diese Funktion nun in unsere Produkte, weil die Technologie einen gewaltigen Sprung nach vorn gemacht hat. Ich glaube, dass es bis vor Kurzem nicht möglich war, wirklich hochwertige dialogorientierte Dienste zu entwickeln, die den erforderlichen Qualitätsstandards entsprechen.
Wie steht es um die Gefahren vor Missbrauch, vor Deepfakes? Welche Schutzmaßnahmen gibt es?
Wir sind natürlich zum Einhalten der geltenden Datenschutzgesetze verpflichtet. Im Laufe der Jahre haben wir eng mit Datenschutzbehörden auf der ganzen Welt zusammengearbeitet und strenge Datenschutzmaßnahmen umgesetzt. So haben wir für Meet klare Richtlinien, wie unser Tool genutzt werden darf. Nutzer:innen ist es beispielsweise nicht gestattet, Meet zu verwenden, um sich als eine andere Person auszugeben.
Technisch gesehen funktioniert die Übersetzungsfunktion ähnlich wie die bestehende Audiokodierung, nur mit der zusätzlichen Funktion der Übersetzung. Jeder Ton, der an das Modell gesendet wird, erzeugt eine Ausgabe. Das Modell arbeitet mit einem 10-Sekunden-Kontextfenster und hat außerhalb dieses Fensters keine semantische Wahrnehmung des gesprochenen Inhalts.
(emw)
Künstliche Intelligenz
Zellen auf Reset: US-Firma sucht mit umstrittener Methode nach dem Jungbrunnen
Kann man den Alterungsprozess umkehren? Diese Frage spielte überraschenderweise kurz auch auf dem vergangenen Weltwirtschaftsforum in Davos eine Rolle. Befragt nach seiner Einschätzung antwortete Elon Musk, dass der Umstand „sehr gut lösbar“ sei und dass es „offensichtlich“ sein werde, wenn Wissenschaftler herausfinden, warum wir altern. So weit, so Elon Musk.
Weiterlesen nach der Anzeige
„Das Altern hat eine relativ einfache Erklärung“
Kurz darauf schaltete sich der Harvard-Professor und Verfechter der Lebensverlängerung David Sinclair in die Unterhaltung auf X ein und stimmte dem reichsten Mann der Welt nachdrücklich zu. „Das Altern hat eine relativ einfache Erklärung und ist offenbar umkehrbar“, schrieb Sinclair. „Klinische Studien beginnen in Kürze.“
„ER-100?“, fragte Musk.
„Ja“, antwortete Sinclair.
ER-100 ist der Codename einer Behandlung, die von Life Biosciences entwickelt wurde, einem kleinen Start-up-Unternehmen aus Boston, das Sinclair mitbegründet hat. Wie Sinclair selbst bestätigte, hatte die Firma jüngst die FDA-Zulassung erhalten, um den ersten gezielten Versuch der Umkehrung des Alterungsprozesses an freiwilligen Probanden durchzuführen.
Das Unternehmen plant, Augenkrankheiten mit einem Verjüngungskonzept namens „Reprogrammierung“ zu behandeln. Dieses Konzept hatte kürzlich Hunderte Millionen an Investitionen für Silicon-Valley-Firmen wie Altos Labs, New Limit und Retro Biosciences angezogen, die wiederum von vielen Tech-Größen unterstützt werden.
Wie funktioniert die „Reprogrammierung“ zur Verjüngung?
Weiterlesen nach der Anzeige
Die Technik versucht, Zellen in einen gesünderen Zustand zurückzuversetzen, indem sie ihre epigenetischen Kontrollen – Schalter an unseren Genen, die bestimmen, welche Gene ein- und ausgeschaltet sind – umfassend zurücksetzt. „Reprogrammierung ist wie die KI der Bio-Welt. Es ist das, was jeder finanziert“, sagt Karl Pfleger, ein Investor, der ein kleineres britisches Start-up namens Shift Bioscience unterstützt. Er sagt, dass Sinclairs Unternehmen kürzlich zusätzliche Mittel gesucht hat, um seine Behandlung weiter voranzutreiben.
Doch die Reprogrammierung ist nicht unumstritten und bringt auch Risiken mit sich. Bei manchen Labortieren hat sie sogar Krebs verursacht. Aber die von Life Biosciences entwickelte Version der Technik hat dem Unternehmen nach erste Sicherheitstests an Tieren bestanden.
Erste Tests an Patienten mit Glaukom
Aber es bleibt risikoreich. In der Studie wird die Behandlung zunächst an etwa einem Dutzend Patienten mit Glaukom getestet. Dabei handelt es sich um eine Erkrankung, bei der hoher Druck im Inneren des Auges den Sehnerv schädigt. In den Tests werden Viren, die drei leistungsstarke Reprogrammierungsgene tragen, in ein Auge der Patienten injiziert. Das geht aus einer Beschreibung in der Studie hervor, die erstmals im Dezember veröffentlicht wurde.
Um sicherzustellen, dass der Prozess nicht zu weit geht, werden die Reprogrammierungsgene durch einen speziellen genetischen Schalter kontrolliert, der sie nur dann aktiviert, wenn die Patienten eine niedrige Dosis des Antibiotikums Doxycyclin einnehmen. Zunächst werden sie das Antibiotikum etwa zwei Monate lang einnehmen, während die Auswirkungen überwacht werden.
Führungskräfte des Unternehmens kündigen schon lange eine in 2026 beginnende Studie an. „Für uns als Branche ist das eine unglaublich große Sache“, sagte Michael Ringel, Chief Operating Officer bei Life Biosciences, bei einer Veranstaltung im Herbst dieses Jahres. „Es wird das erste Mal in der Geschichte der Menschheit sein, in der jahrtausendealten Geschichte der Menschheit, dass nach etwas gesucht wird, das verjüngt … Behalten Sie also diesen Bereich im Auge.“
Die Wurzeln der Reprogrammierungs-Technologie
Die Technologie basiert auf einer vor 20 Jahren mit dem Nobelpreis ausgezeichneten Entdeckung. Die Forschung zeigte, dass die Einführung einiger weniger potenter Gene in eine Zelle dazu führt, dass diese sich wieder in eine Stammzelle zurückverwandelt. Diese Zellen können sich wie in einem frühen Stadium eines Embryos zu verschiedenen spezialisierten Zelltypen entwickeln. Diese Gene, die als Yamanaka-Faktoren bekannt sind, werden mit einem „Reset-Knopf“ für Zellen verglichen. Doch die möglichen Tumorerkrankungen brachten Wissenschaftler auf eine neue Idee, die als „partielle“ oder „vorübergehende“ Reprogrammierung bezeichnet wird. Dabei wird die Exposition gegenüber den starken Genen begrenzt – oder nur auf einen Teil davon beschränkt –, in der Hoffnung, dass die Zellen sich jünger verhalten, ohne dass sie ihre Rolle im Körper vollständig vergessen.
Im Jahr 2020 behauptete Sinclair, dass eine solche partielle Reprogrammierung das Sehvermögen von Mäusen wiederherstellen könnte, nachdem ihre Sehnerven zerstört worden waren, und sagte, es gäbe sogar Hinweise darauf, dass die Nerven nachgewachsen seien.
Nicht alle Wissenschaftler sind sich einig, dass die Reprogrammierung wirklich als Umkehrung des Alterungsprozesses gilt. Aber Sinclair hat nachgelegt. Er vertritt die Theorie, dass der allmähliche Verlust korrekter epigenetischer Informationen in unseren Zellen tatsächlich die eigentliche Ursache des Alterns ist – genau die Art von Grundursache, auf die Musk angespielt hat. „Elon scheint diesem Bereich Aufmerksamkeit zu schenken und [ist] offenbar mit [meiner Theorie] übereinstimmend“, schreibt Sinclair nach einer Anfrage per E-Mail.
Kritiker sprechen von Übertreibung
Sinclair hat sich gänzlich dem Thema Verlängerung der Lebensdauer verschrieben. Als Buchautor und Redner verlangt er astronomische Honorare für seine Vorträge. Zuvor hatte er die Vorteile von Molekülen namens Sirtuine sowie von Resveratrol, einem Molekül, das in Rotwein vorkommt, für die Langlebigkeit angepriesen. Einige Kritiker sagen jedoch, er übertreibe den wissenschaftlichen Fortschritt erheblich. Diese Kritik gipfelte 2024 in einem Artikel im Wall Street Journal, in dem er als „Guru der Umkehrung des Alterungsprozesses“ bezeichnet wurde, dessen Unternehmen „keine Erfolge vorweisen können“.
Life Biosciences gehört zu diesen Unternehmen, die zu kämpfen haben. Die 2017 gegründete Firma verfolgte zunächst die Strategie, Tochtergesellschaften zu gründen, die sich jeweils mit einem Aspekt des Alterungsproblems befassen sollten. Nachdem diese jedoch nur begrenzte Fortschritte erzielten, wurde 2021 ein neuer CEO eingestellt, Jerry McLaughlin, der die Bemühungen des Unternehmens neu auf Sinclairs Ergebnisse mit Mäusen und die Durchführung von Versuchen am Menschen ausgerichtet hat.
Das Unternehmen hat die Möglichkeit diskutiert, andere Organe, darunter auch das Gehirn, umzuprogrammieren. Und Ringel von Life Biosciences spielt ebenso wie Sinclair mit dem Gedanken, dass eines Tages sogar eine Verjüngung des gesamten Körpers möglich sein könnte.
Noch weit von einem Jungbrunnen entfernt
Vorerst sollte man die Studie jedoch eher als Proof of Concept betrachten, das noch weit von einem Jungbrunnen entfernt ist. „Im optimistischen Fall löst dies bei bestimmten Menschen einige Blindheitsprobleme und katalysiert die Arbeit an anderen Indikationen“, sagt der Investor Pfleger. „Es ist nicht so, dass Ihr Arzt Ihnen ein Rezept für eine Pille ausstellt, die Sie verjüngt.“
Die Behandlung von Life basiert auch auf einem Antibiotika-Umschaltmechanismus, der zwar häufig bei Labortieren eingesetzt wird, aber noch nie an Menschen getestet wurde. Da der Schalter aus Genkomponenten von E. coli und dem Herpesvirus aufgebaut ist, könnte er laut Wissenschaftlern beim Menschen eine Immunreaktion auslösen.
„Ich war immer der Meinung, dass man für eine breite Anwendung ein anderes System benötigen würde“, sagt Noah Davidsohn, der Sinclair bei der Umsetzung der Technik half und heute als Chefwissenschaftler bei einem anderen Unternehmen, Rejuvenate Bio, tätig ist. Auch die Wahl der Reprogrammierungsfaktoren durch Life – das Unternehmen hat drei ausgewählt, die unter dem Akronym OSK bekannt sind – könnte riskant sein. Es wird erwartet, dass sie Hunderte anderer Gene aktivieren, und unter bestimmten Umständen kann diese Kombination dazu führen, dass Zellen in einen sehr primitiven, stammzellähnlichen Zustand zurückfallen.
Forschung an Verjüngung ohne unerwünschte Nebenwirkungen
Andere Unternehmen, die sich mit Reprogrammierung befassen, sagen, ihr Fokus liege auf der Erforschung der zu verwendenden Gene, um eine Zeitumkehr ohne unerwünschte Nebenwirkungen zu erreichen. New Limit, das eine umfangreiche Suche nach solchen Genen durchgeführt hat, sagt, dass es erst in zwei Jahren für eine Studie am Menschen bereit sein wird. Bei Shift beginnen die Tierversuche gerade erst.
„Sind ihre Faktoren die beste Version der Verjüngung? Wir glauben nicht. Ich denke, sie arbeiten mit dem, was sie haben“, sagt Daniel Ives, CEO von Shift, über den Konkurrenten Life Biosciences. „Aber ich glaube, dass sie in Bezug auf die Anwendung am Menschen allen anderen weit voraus sind. Sie haben einen Weg gefunden, der über das Auge führt, das ein schönes, in sich geschlossenes System ist. Wenn etwas schiefgeht, hat man immer noch das andere.“
Dieser Beitrag ist zuerst auf t3n.de erschienen.
(jle)
Künstliche Intelligenz
Doom-Scrolling und Suchtgefahr: EU-Kommission fordert Änderungen bei TikTok
Die EU-Kommission hat nach vorläufigen Ergebnissen einer fast zweijährigen Untersuchung festgestellt, dass die Videoplattform TikTok gegen den Digital Services Act (DSA) verstößt. Das Design der Plattform verleite Menschen dazu, möglichst lange auf TikTok zu verweilen, teilte die Kommission am Freitag in Brüssel mit. Sie fordert von TikTok nun eine grundlegende Änderung des App-Designs und weitere Maßnahmen.
Weiterlesen nach der Anzeige
Die Mechanismen, mit denen die Firma möglichen negativen Auswirkungen begegnet, sind aus Sicht der Kommission unzureichend. So habe TikTok etwa unterlassen, der Suchtgefahr vorzubeugen, erklärten hohe EU-Beamte am Freitag. Es gebe keine Zeitbeschränkungen und der Betreiber versuche, die Nutzer in einer Art Endlosschleife zu halten.
Kommission fordert Änderungen
Auch an dem Empfehlungsmechanismus von TikTok hat die Aufsichtsbehörde einiges auszusetzen. Die EU-Kommission sieht darüber hinaus Änderungsbedarf bei den Möglichkeiten für Eltern, den Zugang für Kinder zu kontrollieren oder zu beschränken. Auch das Benachrichtigungssystem sei darauf ausgerichtet, Nutzer möglichst häufig in das Angebot zu locken.
„Das Digitale-Dienste-Gesetz macht Plattformen verantwortlich für jene Effekte, die sie auf Nutzer haben können”, sagt EU-Kommissionsvizepräsidentin Henna Virkkunen. Insbesondere für Kinder und Jugendliche sei Social-Media-Sucht gefährlich und habe negative Auswirkungen auf deren Entwicklung. TikTok sei in vielen europäischen Ländern jene App, die nach Mitternacht noch am häufigsten von Kindern und Jugendlichen genutzt werde – Sperrzeiten oder vergleichbare Mechanismen seien jedoch nicht vorgesehen.
Die EU-Kommission hatte die Untersuchung gegen TikTok im Februar 2024 eingeleitet und dem Unternehmen nun ihre Untersuchungsergebnisse übermittelt. TikTok hat nun die Gelegenheit, Abhilfe zu schaffen. Bislang sei die Zusammenarbeit mit dem Unternehmen konstruktiv gewesen, berichten EU-Beamte. So hatte sich TikTok etwa bei der geforderten Anzeigentransparenz mit der Kommission geeinigt und eine Strafe vermieden.
Doch mit der guten Zusammenarbeit könnte nun Schluss sein: „Die vorläufigen Ergebnisse der Kommission stellen unsere Plattform kategorisch falsch und völlig haltlos dar“, erklärt eine TikTok-Sprecherin. „Wir werden alle notwendigen Schritte unternehmen, um diese Ergebnisse mit allen uns zur Verfügung stehenden Mitteln anzufechten.“
Strafe wäre nächster Schritt
Weiterlesen nach der Anzeige
Ob TikTok die von der EU-Kommission bemängelten Probleme wirksam adressieren wird, ist offen – viel Zeit wollen die Beamten in Brüssel dem Unternehmen aber nicht lassen. Den Rechtsweg allerdings kann die EU-Kommission nicht verkürzen: Einige Wochen werden nun vergehen, bevor Klarheit besteht, ob TikTok den Forderungen der Kommission entspricht. Erst dann kann die Kommission eine formale Strafe verhängen, die bis zu 6 Prozent des weltweiten Jahresumsatzes des Gesamtunternehmens betragen kann. Auch tägliche Strafgelder gegen den Betreiber sind laut DSA möglich.
Das Verfahren gegen TikTok ist das erste DSA-Verfahren, das so weit fortgeschritten ist und dabei auch Designmechanismen einer Plattform thematisiert. Rechtsprechung dazu gibt es bislang auf europäischer Ebene kaum. Die Frage, ab wann App-Nutzung süchtig macht und damit eine Gesundheitsgefahr darstellt, ist höchstrichterlich wie wissenschaftlich bislang nicht abschließend beantwortet. Der DSA verpflichtet Unternehmen aber dazu, auch mögliche Risiken, deren Umfang noch nicht abschließend geklärt ist, in ihre Risikofolgeabschätzung einzubeziehen und ihnen vorzubeugen.
(vbr)
Künstliche Intelligenz
Patentstreit: Münchner Gericht untersagt Renault Verkauf von Clio und Mégane
Das Landgericht München I hat Renault den Verkauf seiner Bestseller-Modelle Clio und Mégane in Deutschland untersagt. Das Gericht gab am Mittwoch dem US-Technologiekonzern Broadcom in einem Patentstreit um Ethernet-Verbindungen recht (Aktenzeichen: 7 O 7655/25). Das berichtet der Fachdienst ip fray. Konkret gehe es um Broadcoms Patent EP1903733 (“Method and system for an extended range ethernet line code”).
Weiterlesen nach der Anzeige
Das Gericht entschied, dass Renault dieses Patent in zwei Fahrzeugmodellen verletzt: beim Clio im Navigationssystem und beim Mégane in der Telematik-Steuereinheit (TCU). Wenn Broadcom sich für eine vorläufige Vollstreckung bis zur erwarteten Berufung entscheidet, muss Renault den Verkauf seiner Modelle Clio und Mégane in Deutschland einstellen. Dafür müsste Broadcom eine Sicherheitsleistung in Höhe von mehreren Millionen Euro bereitstellen.
Verschiedene Medien berichten, dass Renault gegen das Urteil vorgehen wolle. Alternativ können sich die beiden Parteien auch außergerichtlich einigen. Das passiert bei Patenstreitigkeiten häufig, wobei dann oft auch rückwirkend Lizenzzahlungen geleistet werden. Deren Höhe behalten die Streitenden in der Regel für sich.
(jo)
-
Entwicklung & Codevor 3 MonatenKommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac
-
Künstliche Intelligenzvor 1 MonatSchnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt
-
Apps & Mobile Entwicklungvor 2 MonatenHuawei Mate 80 Pro Max: Tandem-OLED mit 8.000 cd/m² für das Flaggschiff-Smartphone
-
Apps & Mobile Entwicklungvor 2 MonatenFast 5 GB pro mm²: Sandisk und Kioxia kommen mit höchster Bitdichte zum ISSCC
-
Entwicklung & Codevor 2 MonatenKommentar: Anthropic verschenkt MCP – mit fragwürdigen Hintertüren
-
Social Mediavor 2 MonatenDie meistgehörten Gastfolgen 2025 im Feed & Fudder Podcast – Social Media, Recruiting und Karriere-Insights
-
Datenschutz & Sicherheitvor 2 MonatenSyncthing‑Fork unter fremder Kontrolle? Community schluckt das nicht
-
Künstliche Intelligenzvor 3 MonatenWeiter billig Tanken und Heizen: Koalition will CO₂-Preis für 2027 nicht erhöhen
