Connect with us

Künstliche Intelligenz

Google Echtzeit-Übersetzer: Mehr als Wort zu Wort Übersetzungen


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Mitten im Meeting Englisch sprechen, während das Gegenüber die Worte in perfektem Spanisch hört – in Echtzeit. Was lange als Science-Fiction galt, rollt Google nun mit Meet und auf Pixel-Geräten aus. Hinter der Funktion steckt dieselbe KI, die auch Gemini antreibt – und ein komplexes Zusammenspiel spezialisierter Übersetzungsmodelle und generativer Sprach-Module.

Weiterlesen nach der Anzeige

Wir haben mit Googles Director Product Management, Niklas Blum, über die zugrunde liegende Technik gesprochen: Wie funktioniert die End-to-End-Sprachübersetzung, die sogar die Originalstimme erhält? Wie arbietet das internationale Team? Und wo liegen die größten Hürden bei der Übersetzung von gesprochener Sprache?

Mit Google Meet kann jeder in einer anderen Sprache sprechen – in Echtzeit. Das klappt mittels KI, konkret ist es derselbe Übersetzer wie in Gemini. Wie funktioniert das? Was passiert in dem Modell?

Aktuell setzen wir spezialisierte Modelle für die Übersetzung und Gemini für die Sprachgenerierung ein. Diese Architektur setzt auf das AudioLM-Framework sowie Transformer-Blöcke und ist darauf ausgelegt, kontinuierliche Audioströme zu verarbeiten. Das ermöglicht es dem Modell, selbstständig zu entscheiden, wann die Übersetzung ausgegeben wird. Wir haben dazu kürzlich einen technischen Research-Blogpost veröffentlicht, der die Funktionsweise dieser End-to-End Speech-to-Speech Translation (S2ST) unter Beibehaltung der Originalstimme erläutert.


Niklas Blum

Niklas Blum

Niklas Blum, Director Product Management bei Google

(Bild: Youtube)

Wie kommt es, dass an dem Echtzeit-Übersetzer ein Team aus Deutschland arbeitet?

Unser Team und unsere Kunden sind global aufgestellt. Die Teams, die an diesem Feature arbeiten, verteilen sich auf Berlin, Stockholm, Zürich, New York und Mountain View. Das Google-Team in Stockholm ist dabei ein zentraler Hub für Googles Echtzeitkommunikation.

Wofür lässt sich der Echtzeit-Übersetzer bisher nutzen? Er ist in Google Meet verfügbar, aber wo kommt er noch zum Einsatz, was ist geplant?

Weiterlesen nach der Anzeige

Die Technologie zur Echtzeit-Übersetzung ist auch auf Pixel-10-Geräten für Anrufe und in Google Translate verfügbar. Bei Google Meet konzentrieren wir uns speziell auf Anwendungsfälle für Echtzeit-Gespräche in Unternehmen, die in verschiedenen Märkten tätig sind und mit Sprachbarrieren zu tun haben. Wir glauben, dass diese Technologie, auch wenn sie noch am Anfang steht, sich rasant weiterentwickeln wird. Echtzeit-Übersetzungen haben das Potenzial, Menschen zu verbinden und Gespräche zu ermöglichen, die so vorher kaum realisierbar waren.

Gesprochene Sprache ist fehlerhafter als geschriebene Sprache. Wie geht das Modell damit um? Wird eins zu eins übersetzt, also auch jedes “ähm” und im Zweifelsfall ein abgebrochener Satz? Denn so sprechen wir manchmal ja. Oder zieht der Echtzeit-Übersetzer auch Schlüsse und bereinigt die Sprache quasi?

Unser Modell zur Echtzeit-Übersetzung nutzt Transformer-Blöcke und besteht aus zwei Hauptkomponenten: einem Streaming-Encoder, der die Quell-Audiodaten basierend auf den vorangegangenen zehn Sekunden der Eingabe zusammenfasst, und einem Streaming-Decoder. Letzterer sagt das übersetzte Audio autoregressiv vorher und nutzt dabei den komprimierten Encoder-Status sowie Vorhersagen aus früheren Iterationen.

Die Transformer-Blöcke ermöglichen es dem Modell, selbstständig zu entscheiden, wann die Übersetzung ausgegeben wird. Basierend auf den Trainingsdaten ist das Modell in der Lage, über reine Wort-für-Wort-Übersetzungen hinauszugehen. Das ist besonders hilfreich bei Redewendungen oder dem Erkennen von Eigennamen. Begriffe wie die „Golden Gate Bridge” werden nicht übersetzt.

Was ist die größte Schwierigkeit bei der Übersetzung gesprochener Sprache? Wo hapert es vielleicht auch manchmal noch?

Bei der Übersetzung gesprochener Sprache stehen drei wesentliche Herausforderungen in Konkurrenz zueinander: Wir wollen eine möglichst hohe Übersetzungsqualität, eine minimale Verzögerung und gleichzeitig die originale Stimmcharakteristik beibehalten. Für Echtzeit-Gespräche wird aktuell eine Standardverzögerung von zwei Sekunden genutzt, was für die meisten Sprachen gut funktioniert. Ein längerer „Lookahead“ des Modells würde durch den zusätzlichen Kontext zwar die Übersetzungsqualität verbessern, beeinträchtigt aber das Echtzeit-Erlebnis. Eine optimale Übersetzungsqualität in möglichst kurzer Zeit zu erzielen, bleibt die zentrale Herausforderung und ein Bereich für weitere Verbesserungen.

Generell haben die Fortschritte bei der KI-Audioverarbeitung und der Modellqualität zuletzt große Sprünge gemacht. Das dürfte der Grund sein, weshalb branchenweit eine zunehmende Integration von Sprachübersetzung in verschiedene Produkte stattfindet.

Es gab eine Zeit, da haben Google und auch andere Anbieter ähnliche Übersetzungstools nicht veröffentlicht, weil Missbrauch drohte. Was hat sich geändert?

Wir integrieren diese Funktion nun in unsere Produkte, weil die Technologie einen gewaltigen Sprung nach vorn gemacht hat. Ich glaube, dass es bis vor Kurzem nicht möglich war, wirklich hochwertige dialogorientierte Dienste zu entwickeln, die den erforderlichen Qualitätsstandards entsprechen.

Wie steht es um die Gefahren vor Missbrauch, vor Deepfakes? Welche Schutzmaßnahmen gibt es?

Wir sind natürlich zum Einhalten der geltenden Datenschutzgesetze verpflichtet. Im Laufe der Jahre haben wir eng mit Datenschutzbehörden auf der ganzen Welt zusammengearbeitet und strenge Datenschutzmaßnahmen umgesetzt. So haben wir für Meet klare Richtlinien, wie unser Tool genutzt werden darf. Nutzer:innen ist es beispielsweise nicht gestattet, Meet zu verwenden, um sich als eine andere Person auszugeben.

Technisch gesehen funktioniert die Übersetzungsfunktion ähnlich wie die bestehende Audiokodierung, nur mit der zusätzlichen Funktion der Übersetzung. Jeder Ton, der an das Modell gesendet wird, erzeugt eine Ausgabe. Das Modell arbeitet mit einem 10-Sekunden-Kontextfenster und hat außerhalb dieses Fensters keine semantische Wahrnehmung des gesprochenen Inhalts.


(emw)



Source link

Künstliche Intelligenz

#TGIQF: Das Quiz rund um das Licht


Der Winter ist noch da und hat Teile von Deutschland mit Schnee und Eis im Griff. Aber ein Ende ist abzusehen: Es ist im Vergleich zum Dezember bereits länger hell. Die knapp 4 Minuten, die Sonne pro Tag länger am Himmel zu sehen ist, machen sich in der Summe deutlich bemerkbar.

Weiterlesen nach der Anzeige

Mehr Licht bedeutet auch, dass die Tage „länger“ werden. Am Licht orientieren sich Mensch und Natur und legen ihren Tagesrhythmus nach der Sonne. Licht ist aber auch physikalisch sehr spannend.


#TGIQF: Das heise-online-Quiz

#TGIQF: Das heise-online-Quiz

„Thank God It’s Quiz Friday!“ Jeden Freitag gibts ein neues Quiz aus den Themenbereichen IT, Technik, Entertainment oder Nerd-Wissen:

In unserem Quiz dreht sich zur Feier des täglichen Helligkeitsgewinns alles um das Thema Licht. Die meisten Fragen drehen sich um Physik, Namen und Eigenschaften, um das Partywissen zu erweitern, wenn die Schuldaten nicht mehr griffbereit im Kopf liegen.

Wer hat einen Nobelpreis für Physik wegen der Beschreibung des Photoeffekts erhalten? Das wollen wir von Ihnen wissen, in unserem kleinen Nerdquiz zum Wochenendstart. Wir bekennen, wie einst die Münchner Freiheit in ihrem etwas unbeholfenem Versuch, den NDW-Hype mitzunehmen: Wir steh’n auf Licht!

Auch in dieser Woche lieferten die #heiseshow und Moderatorin Anna Bicker drei Fragen vorab: Dr. Volker Zota und Malte Kirchner ließen ihr Licht leuchten und glänzten mit richtigen Antworten. Das genannte arte-Video zum problematischen Verhältnis der Physik zum Lichtschwert finden Sie hier.

Sie können in Ruhe in 10 Fragen maximal 100 Punkte erreichen. Die Punktzahl kann gern im Forum mit anderen Mitspielern verglichen werden. Halten Sie sich dabei aber bitte mit Spoilern zurück, um anderen Teilnehmern nicht die Freude am Quiz zu verhageln. Lob und Kritik sind wie immer gern gelesen.

Weiterlesen nach der Anzeige

Bleiben Sie zudem auf dem Laufenden und erfahren Sie das Neueste aus der IT-Welt: Folgen Sie uns bei Mastodon, auf Facebook oder Instagram. Und schauen Sie auch gern beim Redaktionsbot Botti vorbei.

Und falls Sie Ideen für eigene Quizze haben, schreiben Sie einfach eine Mail an den Quizmaster aka Herr der fiesen Fragen.


(mawi)





Source link

Weiterlesen

Künstliche Intelligenz

Zellen auf Reset: US-Firma sucht mit umstrittener Methode nach dem Jungbrunnen


Kann man den Alterungsprozess umkehren? Diese Frage spielte überraschenderweise kurz auch auf dem vergangenen Weltwirtschaftsforum in Davos eine Rolle. Befragt nach seiner Einschätzung antwortete Elon Musk, dass der Umstand „sehr gut lösbar“ sei und dass es „offensichtlich“ sein werde, wenn Wissenschaftler herausfinden, warum wir altern. So weit, so Elon Musk.

Weiterlesen nach der Anzeige

Kurz darauf schaltete sich der Harvard-Professor und Verfechter der Lebensverlängerung David Sinclair in die Unterhaltung auf X ein und stimmte dem reichsten Mann der Welt nachdrücklich zu. „Das Altern hat eine relativ einfache Erklärung und ist offenbar umkehrbar“, schrieb Sinclair. „Klinische Studien beginnen in Kürze.“

„ER-100?“, fragte Musk.

„Ja“, antwortete Sinclair.

ER-100 ist der Codename einer Behandlung, die von Life Biosciences entwickelt wurde, einem kleinen Start-up-Unternehmen aus Boston, das Sinclair mitbegründet hat. Wie Sinclair selbst bestätigte, hatte die Firma jüngst die FDA-Zulassung erhalten, um den ersten gezielten Versuch der Umkehrung des Alterungsprozesses an freiwilligen Probanden durchzuführen.

Das Unternehmen plant, Augenkrankheiten mit einem Verjüngungskonzept namens „Reprogrammierung“ zu behandeln. Dieses Konzept hatte kürzlich Hunderte Millionen an Investitionen für Silicon-Valley-Firmen wie Altos Labs, New Limit und Retro Biosciences angezogen, die wiederum von vielen Tech-Größen unterstützt werden.

Weiterlesen nach der Anzeige

Die Technik versucht, Zellen in einen gesünderen Zustand zurückzuversetzen, indem sie ihre epigenetischen Kontrollen – Schalter an unseren Genen, die bestimmen, welche Gene ein- und ausgeschaltet sind – umfassend zurücksetzt. „Reprogrammierung ist wie die KI der Bio-Welt. Es ist das, was jeder finanziert“, sagt Karl Pfleger, ein Investor, der ein kleineres britisches Start-up namens Shift Bioscience unterstützt. Er sagt, dass Sinclairs Unternehmen kürzlich zusätzliche Mittel gesucht hat, um seine Behandlung weiter voranzutreiben.

Doch die Reprogrammierung ist nicht unumstritten und bringt auch Risiken mit sich. Bei manchen Labortieren hat sie sogar Krebs verursacht. Aber die von Life Biosciences entwickelte Version der Technik hat dem Unternehmen nach erste Sicherheitstests an Tieren bestanden.

Aber es bleibt risikoreich. In der Studie wird die Behandlung zunächst an etwa einem Dutzend Patienten mit Glaukom getestet. Dabei handelt es sich um eine Erkrankung, bei der hoher Druck im Inneren des Auges den Sehnerv schädigt. In den Tests werden Viren, die drei leistungsstarke Reprogrammierungsgene tragen, in ein Auge der Patienten injiziert. Das geht aus einer Beschreibung in der Studie hervor, die erstmals im Dezember veröffentlicht wurde.

Um sicherzustellen, dass der Prozess nicht zu weit geht, werden die Reprogrammierungsgene durch einen speziellen genetischen Schalter kontrolliert, der sie nur dann aktiviert, wenn die Patienten eine niedrige Dosis des Antibiotikums Doxycyclin einnehmen. Zunächst werden sie das Antibiotikum etwa zwei Monate lang einnehmen, während die Auswirkungen überwacht werden.

Führungskräfte des Unternehmens kündigen schon lange eine in 2026 beginnende Studie an. „Für uns als Branche ist das eine unglaublich große Sache“, sagte Michael Ringel, Chief Operating Officer bei Life Biosciences, bei einer Veranstaltung im Herbst dieses Jahres. „Es wird das erste Mal in der Geschichte der Menschheit sein, in der jahrtausendealten Geschichte der Menschheit, dass nach etwas gesucht wird, das verjüngt … Behalten Sie also diesen Bereich im Auge.“

Die Technologie basiert auf einer vor 20 Jahren mit dem Nobelpreis ausgezeichneten Entdeckung. Die Forschung zeigte, dass die Einführung einiger weniger potenter Gene in eine Zelle dazu führt, dass diese sich wieder in eine Stammzelle zurückverwandelt. Diese Zellen können sich wie in einem frühen Stadium eines Embryos zu verschiedenen spezialisierten Zelltypen entwickeln. Diese Gene, die als Yamanaka-Faktoren bekannt sind, werden mit einem „Reset-Knopf“ für Zellen verglichen. Doch die möglichen Tumorerkrankungen brachten Wissenschaftler auf eine neue Idee, die als „partielle“ oder „vorübergehende“ Reprogrammierung bezeichnet wird. Dabei wird die Exposition gegenüber den starken Genen begrenzt – oder nur auf einen Teil davon beschränkt –, in der Hoffnung, dass die Zellen sich jünger verhalten, ohne dass sie ihre Rolle im Körper vollständig vergessen.

Im Jahr 2020 behauptete Sinclair, dass eine solche partielle Reprogrammierung das Sehvermögen von Mäusen wiederherstellen könnte, nachdem ihre Sehnerven zerstört worden waren, und sagte, es gäbe sogar Hinweise darauf, dass die Nerven nachgewachsen seien.

Nicht alle Wissenschaftler sind sich einig, dass die Reprogrammierung wirklich als Umkehrung des Alterungsprozesses gilt. Aber Sinclair hat nachgelegt. Er vertritt die Theorie, dass der allmähliche Verlust korrekter epigenetischer Informationen in unseren Zellen tatsächlich die eigentliche Ursache des Alterns ist – genau die Art von Grundursache, auf die Musk angespielt hat. „Elon scheint diesem Bereich Aufmerksamkeit zu schenken und [ist] offenbar mit [meiner Theorie] übereinstimmend“, schreibt Sinclair nach einer Anfrage per E-Mail.

Sinclair hat sich gänzlich dem Thema Verlängerung der Lebensdauer verschrieben. Als Buchautor und Redner verlangt er astronomische Honorare für seine Vorträge. Zuvor hatte er die Vorteile von Molekülen namens Sirtuine sowie von Resveratrol, einem Molekül, das in Rotwein vorkommt, für die Langlebigkeit angepriesen. Einige Kritiker sagen jedoch, er übertreibe den wissenschaftlichen Fortschritt erheblich. Diese Kritik gipfelte 2024 in einem Artikel im Wall Street Journal, in dem er als „Guru der Umkehrung des Alterungsprozesses“ bezeichnet wurde, dessen Unternehmen „keine Erfolge vorweisen können“.

Life Biosciences gehört zu diesen Unternehmen, die zu kämpfen haben. Die 2017 gegründete Firma verfolgte zunächst die Strategie, Tochtergesellschaften zu gründen, die sich jeweils mit einem Aspekt des Alterungsproblems befassen sollten. Nachdem diese jedoch nur begrenzte Fortschritte erzielten, wurde 2021 ein neuer CEO eingestellt, Jerry McLaughlin, der die Bemühungen des Unternehmens neu auf Sinclairs Ergebnisse mit Mäusen und die Durchführung von Versuchen am Menschen ausgerichtet hat.

Das Unternehmen hat die Möglichkeit diskutiert, andere Organe, darunter auch das Gehirn, umzuprogrammieren. Und Ringel von Life Biosciences spielt ebenso wie Sinclair mit dem Gedanken, dass eines Tages sogar eine Verjüngung des gesamten Körpers möglich sein könnte.

Vorerst sollte man die Studie jedoch eher als Proof of Concept betrachten, das noch weit von einem Jungbrunnen entfernt ist. „Im optimistischen Fall löst dies bei bestimmten Menschen einige Blindheitsprobleme und katalysiert die Arbeit an anderen Indikationen“, sagt der Investor Pfleger. „Es ist nicht so, dass Ihr Arzt Ihnen ein Rezept für eine Pille ausstellt, die Sie verjüngt.“

Die Behandlung von Life basiert auch auf einem Antibiotika-Umschaltmechanismus, der zwar häufig bei Labortieren eingesetzt wird, aber noch nie an Menschen getestet wurde. Da der Schalter aus Genkomponenten von E. coli und dem Herpesvirus aufgebaut ist, könnte er laut Wissenschaftlern beim Menschen eine Immunreaktion auslösen.

„Ich war immer der Meinung, dass man für eine breite Anwendung ein anderes System benötigen würde“, sagt Noah Davidsohn, der Sinclair bei der Umsetzung der Technik half und heute als Chefwissenschaftler bei einem anderen Unternehmen, Rejuvenate Bio, tätig ist. Auch die Wahl der Reprogrammierungsfaktoren durch Life – das Unternehmen hat drei ausgewählt, die unter dem Akronym OSK bekannt sind – könnte riskant sein. Es wird erwartet, dass sie Hunderte anderer Gene aktivieren, und unter bestimmten Umständen kann diese Kombination dazu führen, dass Zellen in einen sehr primitiven, stammzellähnlichen Zustand zurückfallen.

Andere Unternehmen, die sich mit Reprogrammierung befassen, sagen, ihr Fokus liege auf der Erforschung der zu verwendenden Gene, um eine Zeitumkehr ohne unerwünschte Nebenwirkungen zu erreichen. New Limit, das eine umfangreiche Suche nach solchen Genen durchgeführt hat, sagt, dass es erst in zwei Jahren für eine Studie am Menschen bereit sein wird. Bei Shift beginnen die Tierversuche gerade erst.

„Sind ihre Faktoren die beste Version der Verjüngung? Wir glauben nicht. Ich denke, sie arbeiten mit dem, was sie haben“, sagt Daniel Ives, CEO von Shift, über den Konkurrenten Life Biosciences. „Aber ich glaube, dass sie in Bezug auf die Anwendung am Menschen allen anderen weit voraus sind. Sie haben einen Weg gefunden, der über das Auge führt, das ein schönes, in sich geschlossenes System ist. Wenn etwas schiefgeht, hat man immer noch das andere.“

Dieser Beitrag ist zuerst auf t3n.de erschienen.


(jle)



Source link

Weiterlesen

Künstliche Intelligenz

Doom-Scrolling und Suchtgefahr: EU-Kommission fordert Änderungen bei TikTok


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Die EU-Kommission hat nach vorläufigen Ergebnissen einer fast zweijährigen Untersuchung festgestellt, dass die Videoplattform TikTok gegen den Digital Services Act (DSA) verstößt. Das Design der Plattform verleite Menschen dazu, möglichst lange auf TikTok zu verweilen, teilte die Kommission am Freitag in Brüssel mit. Sie fordert von TikTok nun eine grundlegende Änderung des App-Designs und weitere Maßnahmen.

Weiterlesen nach der Anzeige

Die Mechanismen, mit denen die Firma möglichen negativen Auswirkungen begegnet, sind aus Sicht der Kommission unzureichend. So habe TikTok etwa unterlassen, der Suchtgefahr vorzubeugen, erklärten hohe EU-Beamte am Freitag. Es gebe keine Zeitbeschränkungen und der Betreiber versuche, die Nutzer in einer Art Endlosschleife zu halten.

Auch an dem Empfehlungsmechanismus von TikTok hat die Aufsichtsbehörde einiges auszusetzen. Die EU-Kommission sieht darüber hinaus Änderungsbedarf bei den Möglichkeiten für Eltern, den Zugang für Kinder zu kontrollieren oder zu beschränken. Auch das Benachrichtigungssystem sei darauf ausgerichtet, Nutzer möglichst häufig in das Angebot zu locken.

„Das Digitale-Dienste-Gesetz macht Plattformen verantwortlich für jene Effekte, die sie auf Nutzer haben können”, sagt EU-Kommissionsvizepräsidentin Henna Virkkunen. Insbesondere für Kinder und Jugendliche sei Social-Media-Sucht gefährlich und habe negative Auswirkungen auf deren Entwicklung. TikTok sei in vielen europäischen Ländern jene App, die nach Mitternacht noch am häufigsten von Kindern und Jugendlichen genutzt werde – Sperrzeiten oder vergleichbare Mechanismen seien jedoch nicht vorgesehen.

Die EU-Kommission hatte die Untersuchung gegen TikTok im Februar 2024 eingeleitet und dem Unternehmen nun ihre Untersuchungsergebnisse übermittelt. TikTok hat nun die Gelegenheit, Abhilfe zu schaffen. Bislang sei die Zusammenarbeit mit dem Unternehmen konstruktiv gewesen, berichten EU-Beamte. So hatte sich TikTok etwa bei der geforderten Anzeigentransparenz mit der Kommission geeinigt und eine Strafe vermieden.

Doch mit der guten Zusammenarbeit könnte nun Schluss sein: „Die vorläufigen Ergebnisse der Kommission stellen unsere Plattform kategorisch falsch und völlig haltlos dar“, erklärt eine TikTok-Sprecherin. „Wir werden alle notwendigen Schritte unternehmen, um diese Ergebnisse mit allen uns zur Verfügung stehenden Mitteln anzufechten.“

Weiterlesen nach der Anzeige

Ob TikTok die von der EU-Kommission bemängelten Probleme wirksam adressieren wird, ist offen – viel Zeit wollen die Beamten in Brüssel dem Unternehmen aber nicht lassen. Den Rechtsweg allerdings kann die EU-Kommission nicht verkürzen: Einige Wochen werden nun vergehen, bevor Klarheit besteht, ob TikTok den Forderungen der Kommission entspricht. Erst dann kann die Kommission eine formale Strafe verhängen, die bis zu 6 Prozent des weltweiten Jahresumsatzes des Gesamtunternehmens betragen kann. Auch tägliche Strafgelder gegen den Betreiber sind laut DSA möglich.

Das Verfahren gegen TikTok ist das erste DSA-Verfahren, das so weit fortgeschritten ist und dabei auch Designmechanismen einer Plattform thematisiert. Rechtsprechung dazu gibt es bislang auf europäischer Ebene kaum. Die Frage, ab wann App-Nutzung süchtig macht und damit eine Gesundheitsgefahr darstellt, ist höchstrichterlich wie wissenschaftlich bislang nicht abschließend beantwortet. Der DSA verpflichtet Unternehmen aber dazu, auch mögliche Risiken, deren Umfang noch nicht abschließend geklärt ist, in ihre Risikofolgeabschätzung einzubeziehen und ihnen vorzubeugen.


(vbr)



Source link

Weiterlesen

Beliebt