Künstliche Intelligenz
Googles Veo 3 erstellt geniale Videos – aber die Untertitel sind völlig verrückt
Nachdem Google Ende Mai sein neuestes KI-Modell zur Videogenerierung vorgestellt hatte, stürzten sich Kreative darauf, um es auf Herz und Nieren zu testen. Nur wenige Monate nach der Verfügbarmachung seines Vorgängers ermöglicht Veo 3 Nutzern erstmals die Generierung von Klängen und Dialogen, was zu einer Flut hyperrealistischer maximal achtsekündiger Clips führte, die dann zu Werbespots, ASMR-Videos, imaginären Filmtrailern oder humorvollen Fake-Straßeninterviews zusammengeschnitten wurden. Der Oscar-nominierte Regisseur Darren Aronofsky nutzte das Tool gar, um einen Kurzfilm mit dem Titel „Ancestra“ zu erstellen. Während einer Google-Pressekonferenz verglich Demis Hassabis, CEO der Google-KI-Tochter DeepMind, diesen Sprung nach vorne mit dem „Ende der Stummfilmära in der Videogenierung“.
Einige Nutzer stellten jedoch schnell fest, dass das Tool keineswegs perfekt war und in mancher Hinsicht nicht wie erwartet arbeitete. Denn: Wenn Veo 3 Clips mit Dialogen generiert, fügt es oft unsinnige, verstümmelte Untertitel hinzu, selbst wenn in den Eingabeaufforderungen ausdrücklich angegeben wurde, das zu unterlassen. Die Nonsens-Untertitel zu entfernen, ist aber nicht einfach – und auch nicht billig. Nutzer sind nämlich gezwungen, Clips neu generieren zu lassen (was sie mehr Geld kostet) – in der Hoffnung, dass es nicht wieder passiert. Alternativ müssen sie externe Tools zum Entfernen von Untertiteln verwenden oder ihre Videos störend zuschneiden, um die Untertitel vollständig zu entfernen.
Google seit mehr als einem Monat informiert
Josh Woodward, Vizepräsident von Google Labs und Gemini, veröffentlichte schon am 9. Juni auf X den Hinweis, dass Google Korrekturmaßnahmen ergriffen habe, um die Ausgabe der unsinnigen Untertitel zu reduzieren. Aber auch über einen Monat später melden Nutzer immer noch Probleme damit im offiziellen Discord-Kanal von Google Labs, ohne dass sie Hilfe bekommen. Das zeigt, wie offenkundig schwierig es sein kann, Fehler in großen KI-Modellen, Bild- und Videogenratoren zu beheben.
Wie seine Vorgänger ist Veo 3 für zahlende Mitglieder größerer Google-Abonnementstufen verfügbar, die nicht billig sind: Es geht bei 249,99 US-Dollar pro Monat erst los. Um einen achtsekündigen Clip zu erstellen, geben Nutzer einen Prompt in Googles KI-Filmtool Flow, in Gemini oder andere Google-KI-Plattformen ein, der die Szene beschreibt, die sie erstellen möchten. Doch das Abo allein reicht nicht: Jede Veo-3-Videogenerierung kostet mindestens 20 KI-Credits, die 25 US-Dollar pro 2.500 Credits kosten. Mona Weiss, Kreativdirektorin in der Werbebranche, erzählt, dass das Neugenerieren von Szenen, um die quatschigen Untertitel loszuwerden, schnell teuer wird. „Wenn man eine Szene mit Dialogen erstellt, haben bis zu 40 Prozent der Ausgaben diese unverständlichen Untertitel, die sie dann unbrauchbar machen“, sagt sie. „Man verbrennt also Geld, um eine Szene zu erhalten, die einem gefällt, aber dann kann man sie letztlich nicht einmal verwenden.“
Credits futsch, teures Abo zahlt man obendrein
Als Weiss das Problem über den Discord-Kanal an Google Labs meldete, in der Hoffnung, eine Rückerstattung für ihre verschwendeten Credits zu erhalten, verwies das dortige Team sie nur an den offiziellen Support des Unternehmens. Dieser bot ihr nur eine Rückerstattung der Kosten für Veo 3 an, jedoch nicht für die Credits. Weiss lehnte das ab, da sie damit den Zugriff auf die Videogenerierung vollständig verloren hätte. Das Discord-Supportteam von Google Labs räumte ein, dass unerwünschte Untertitel durch Szenen mit Sprache ausgelöst werden können. Man sei sich des Problems bewusst und arbeite daran.
Aber warum besteht Veo 3 darauf, die Quatsch-Untertitel hinzuzufügen, und warum scheint es so schwierig zu sein, das Problem zu lösen? Das liegt wahrscheinlich daran, wie konkret das Modell trainiert wurde. Obwohl Google diese Informationen nicht veröffentlicht, enthalten die Trainingsdaten wahrscheinlich YouTube-Videos, Clips aus Vlogs und Gaming-Kanälen sowie deren TikTok-Edits, von denen viele mit Untertiteln versehen sind. Diese eingebetteten Untertitel sind Teil der Videobilder und keine separaten Textspuren, die darüber gelegt werden. Daher ist es schwierig, sie zu entfernen, bevor sie für das Training verwendet werden können, sagt Shuo Niu, Assistenzprofessor an der Clark University in Massachusetts, der sich mit Videoplattformen und KI beschäftigt.
Unreifes Produkt auf den Markt geworfen?
„Das Text-zu-Video-Modell wird mithilfe von Reinforcement Learning trainiert, um Inhalte zu produzieren, die von Menschen erstellte Videos imitieren. Wenn solche Videos Untertitel enthalten, kann das Modell lernen, dass die Einbindung von Untertiteln die Ähnlichkeit mit von Menschen erstellten Inhalten erhöht“, sagt der Forscher. „Wir arbeiten kontinuierlich daran, die Videogenerierung zu verbessern, insbesondere in Bezug auf Text, natürlich klingende Sprache und perfekt synchronisierten Ton“, gab ein Google-Sprecher an. „Wir empfehlen Nutzern, ihren Prompt erneut zu versuchen, wenn sie Unstimmigkeiten feststellen, und uns über die Daumen-hoch/Daumen-herunter-Option ein Feedback zu geben.“ Warum das Modell Anweisungen wie „keine Untertitel“ oft ignoriert, liegt unterdessen wohl daran, dass negative Eingaben (die einem generativen KI-Modell sagen, etwas nicht zu tun) in der Regel weniger effektiv sind als positive Prompts. Davon geht auch Tuhin Chakrabarty, Assistenzprofessor an der Stony Brook University, der sich mit KI-Systemen beschäftigt, aus.
Um das Problem zu beheben, müsste Google letztlich jedes Frame jedes Videos, mit dem Veo 3 trainiert wurde, überprüfen und diejenigen mit Untertiteln entweder entfernen oder neu kennzeichnen, bevor das Modell neu trainiert wird. Das sei ein Unterfangen, das mindestens Wochen dauern würde, sagt Chakrabarty. Katerina Cizek, Dokumentarfilmerin und künstlerische Leiterin am MIT Open Documentary Lab, meint, dass dieses Problem beispielhaft für die Bereitschaft von Google sei, Produkte auf den Markt zu werfen, bevor sie vollständig ausgereift sind. „Google brauchte hier einen Erfolg“, sagt sie. „Die mussten die Ersten sein, die ein Tool auf den Markt bringen, das lippensynchronen Ton mit Video generiert. Das war ihnen wichtiger als die Behebung des Problems mit den Untertiteln.“
Dieser Beitrag ist zuerst bei t3n.de erschienen.
(jle)
Künstliche Intelligenz
Kommentar zum Jugendschutz: There is no app for that!
Alle Eltern wissen es: Kaum etwas reizt jugendliche Kreativität mehr, als ein Verbot auszusprechen. Der Süßigkeitenschrank ist abgeschlossen? Kein Problem, auf YouTube weisen hunderte Lockpicking-Tutorials den Weg. Die Porno-Website hat eine Ü-18-Prüfung vorgeschaltet? Na, es gibt doch VPN-Anbieter, die ihren Service anonym und gegen Barzahlung freischalten. Meistens allerdings bekommen die Eltern zu spät oder nie etwas von diesem Einfallsreichtum mit, denn natürlich behalten Kinder es lieber für sich, wenn sie gegen Regeln verstoßen.
Holger Bleich schreibt seit 1999 für c’t und heise online. Den Schwerpunkt bilden Technik-Themen wie Internet-Protokolle und Webhosting. Aus seinem Studium hat sich der diplomierte Politikwissenschaftler sein Interesse für juristische und kulturelle Aspekte der Netznutzung sowie für Netzpolitik erhalten.
Nur eines ist für den Jugendschutz noch schädlicher als gar kein Verbot, nämlich ein löchrig umgesetztes Verbot. Seit langen Jahren lautet die Antwort der Politik auf jugendgefährdende Inhalte im Netz dennoch: Keine Sorge, liebe Eltern, wir kümmern uns mit technischen Lösungen um dieses gesellschaftliche Problem. Ganz nach dem Motto der Apple-Reklame aus den 10er Jahren: „There’s An App For That!“ Gerade lässt sich wieder ein wahres Feuerwerk an symbolpolitischen Forderungen beobachten, deren Kern sich auf Apples Claim reduzieren lässt.
Dabei hat noch keine Jugendschutzbarriere für Onlinedienste wirklich funktioniert. Die gesetzlich verordneten Altersschranken für Porno-Websites in Frankreich und Großbritannien belegen allenfalls, wie leicht sie sich mit etwas Einfallsreichtum umgehen lassen. Davon unbeeindruckt behauptet die EU-Kommission nun, mit ihrer App zur Altersverifikation im Web allen Mitgliedsstaaten die eine tolle Lösung anbieten zu können. Social-Media-Verbote für Kinder können kommen, denn: „There’s an app for that“.
Viele Eltern werden es praktisch finden, sie müssen sich nicht mehr um das kümmern, was die Schutzbefohlenen mit ihrem Smartphone den ganzen Tag so treiben. Bis sie selbst ständig auf Barrieren im Web treffen und die App zücken müssen. Denn was viele nicht bedenken: Jugendschutz am Einlass heißt Ausweiskontrolle für alle! Spätestens dann könnten die Erwachsenen von den Smartphonefertigkeiten ihrer Kinder profitieren, um nämlich von ihnen zu lernen, wie man diese nervigen Jugendschutz-Banner umgehen kann.
Wir brennen für kritischen und fundierten IT-Journalismus. Sie auch? Wenn Ihnen dieser Artikel gefallen hat, dann unterstützen Sie uns jetzt mit einem Abonnement und freuen sich auf detaillierte Anleitungen, umfangreiche Tests und tiefgehende Reportagen.
(hob)
Künstliche Intelligenz
So testen Sie Ihren Browser auf Datenschutz
Browser sind treue Wegbegleiter: Hat man sich einmal an einen gewöhnt, nutzt man ihn nicht selten viele Jahre. Aber wie treu ist der Browser, wenn es darum geht, das Surfverhalten, die persönlichen Interessen und sonstige Daten vor neugierigen Trackingfirmen und anderen Datenkraken zu verbergen?
Manche Browserhersteller wie Brave machen hierzu vollmundige Versprechen, andere wie Google halten sich vornehm zurück. Doch wie gut Ihre Daten wirklich geschützt sind, erfahren Sie nur, wenn Sie selbst nachforschen. Das ist weniger aufwendig, als es zunächst klingen mag.
Anschließend können Sie selbst entscheiden, ob Ihr aktueller Schutz ausreicht oder ob Sie ihn verbessern möchten – etwa, indem Sie Ihren Browser durch Einstellungen und Erweiterungen auf Datenschutz trimmen oder ob Sie gleich zu einer Alternative wechseln, die schon im Auslieferungszustand gute Dienste leistet.
Das war die Leseprobe unseres heise-Plus-Artikels „So testen Sie Ihren Browser auf Datenschutz“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.
Künstliche Intelligenz
c’t-Webinar: E-Auto im Check: Technik, Laden, Umweltbilanz
Immer mehr Menschen überlegen, ob sie beim nächsten Autokauf auf einen Stromer umsteigen oder doch besser bei einem klassischen Antrieb bleiben. Andere haben sich innerlich schon entschieden, möchten aber letzte Zweifel ausräumen.
Im Webinar geben die c’t-Redakteure Stefan Porteck und Sven Hansen Orientierung: Sie erklären Stärken und Schwächen der verschiedenen Konzepte, räumen mit Mythen auf und helfen dabei, Fehlentscheidungen zu vermeiden.
Technische Grundlagen und Praxiswissen
Wer bislang keine Erfahrung mit Elektroautos hat, findet damit im Webinar Antworten auf typische Fragen: Komme ich zuverlässig ans Ziel? Genügt die Reichweite auch im Winter? Wie lade ich zu Hause sicher und effizient? Wie hoch ist die Brandgefahr? Neben Technik und Praxis fließt auch die Umweltbilanz in die Betrachtung ein.
Ausblick und Anmeldung
Am Ende richten die Redakteure den Blick in die Zukunft: Sie diskutieren neue Batteriegenerationen, Chancen von Wasserstoff und E-Fuels sowie die Entwicklung der Ladeinfrastruktur.
Das Webinar richtet sich an alle, die über den Umstieg auf ein Elektroauto nachdenken oder Alternativen zum Verbrenner prüfen. Vorkenntnisse sind nicht nötig – entscheidend ist die Bereitschaft, sich intensiv mit dem Thema auseinanderzusetzen.
- Datum: 09. Oktober 2025
- Uhrzeit: 15:00 bis 17:00 Uhr
- Preis: 59,00 Euro (Frühbucherpreis bis zum 11. September, danach 69,00 Euro)
- Zur Teilnahme benötigen Sie lediglich einen aktuellen Browser. Alle weiteren Informationen sowie Details zur Anmeldung finden Sie auf der Webseite von heise academy.
(abr)
-
Datenschutz & Sicherheitvor 3 Monaten
Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken
-
UX/UI & Webdesignvor 3 Wochen
Der ultimative Guide für eine unvergessliche Customer Experience
-
Apps & Mobile Entwicklungvor 3 Monaten
Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen
-
Online Marketing & SEOvor 3 Monaten
TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings
-
UX/UI & Webdesignvor 1 Woche
Adobe Firefly Boards › PAGE online
-
Social Mediavor 3 Wochen
Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist
-
Entwicklung & Codevor 3 Wochen
Posit stellt Positron vor: Neue IDE für Data Science mit Python und R
-
Entwicklung & Codevor 4 Tagen
EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events