Künstliche Intelligenz
Googles Veo 3 erstellt geniale Videos – aber die Untertitel sind völlig verrückt
Nachdem Google Ende Mai sein neuestes KI-Modell zur Videogenerierung vorgestellt hatte, stürzten sich Kreative darauf, um es auf Herz und Nieren zu testen. Nur wenige Monate nach der Verfügbarmachung seines Vorgängers ermöglicht Veo 3 Nutzern erstmals die Generierung von Klängen und Dialogen, was zu einer Flut hyperrealistischer maximal achtsekündiger Clips führte, die dann zu Werbespots, ASMR-Videos, imaginären Filmtrailern oder humorvollen Fake-Straßeninterviews zusammengeschnitten wurden. Der Oscar-nominierte Regisseur Darren Aronofsky nutzte das Tool gar, um einen Kurzfilm mit dem Titel „Ancestra“ zu erstellen. Während einer Google-Pressekonferenz verglich Demis Hassabis, CEO der Google-KI-Tochter DeepMind, diesen Sprung nach vorne mit dem „Ende der Stummfilmära in der Videogenierung“.
Einige Nutzer stellten jedoch schnell fest, dass das Tool keineswegs perfekt war und in mancher Hinsicht nicht wie erwartet arbeitete. Denn: Wenn Veo 3 Clips mit Dialogen generiert, fügt es oft unsinnige, verstümmelte Untertitel hinzu, selbst wenn in den Eingabeaufforderungen ausdrücklich angegeben wurde, das zu unterlassen. Die Nonsens-Untertitel zu entfernen, ist aber nicht einfach – und auch nicht billig. Nutzer sind nämlich gezwungen, Clips neu generieren zu lassen (was sie mehr Geld kostet) – in der Hoffnung, dass es nicht wieder passiert. Alternativ müssen sie externe Tools zum Entfernen von Untertiteln verwenden oder ihre Videos störend zuschneiden, um die Untertitel vollständig zu entfernen.
Google seit mehr als einem Monat informiert
Josh Woodward, Vizepräsident von Google Labs und Gemini, veröffentlichte schon am 9. Juni auf X den Hinweis, dass Google Korrekturmaßnahmen ergriffen habe, um die Ausgabe der unsinnigen Untertitel zu reduzieren. Aber auch über einen Monat später melden Nutzer immer noch Probleme damit im offiziellen Discord-Kanal von Google Labs, ohne dass sie Hilfe bekommen. Das zeigt, wie offenkundig schwierig es sein kann, Fehler in großen KI-Modellen, Bild- und Videogenratoren zu beheben.
Wie seine Vorgänger ist Veo 3 für zahlende Mitglieder größerer Google-Abonnementstufen verfügbar, die nicht billig sind: Es geht bei 249,99 US-Dollar pro Monat erst los. Um einen achtsekündigen Clip zu erstellen, geben Nutzer einen Prompt in Googles KI-Filmtool Flow, in Gemini oder andere Google-KI-Plattformen ein, der die Szene beschreibt, die sie erstellen möchten. Doch das Abo allein reicht nicht: Jede Veo-3-Videogenerierung kostet mindestens 20 KI-Credits, die 25 US-Dollar pro 2.500 Credits kosten. Mona Weiss, Kreativdirektorin in der Werbebranche, erzählt, dass das Neugenerieren von Szenen, um die quatschigen Untertitel loszuwerden, schnell teuer wird. „Wenn man eine Szene mit Dialogen erstellt, haben bis zu 40 Prozent der Ausgaben diese unverständlichen Untertitel, die sie dann unbrauchbar machen“, sagt sie. „Man verbrennt also Geld, um eine Szene zu erhalten, die einem gefällt, aber dann kann man sie letztlich nicht einmal verwenden.“
Credits futsch, teures Abo zahlt man obendrein
Als Weiss das Problem über den Discord-Kanal an Google Labs meldete, in der Hoffnung, eine Rückerstattung für ihre verschwendeten Credits zu erhalten, verwies das dortige Team sie nur an den offiziellen Support des Unternehmens. Dieser bot ihr nur eine Rückerstattung der Kosten für Veo 3 an, jedoch nicht für die Credits. Weiss lehnte das ab, da sie damit den Zugriff auf die Videogenerierung vollständig verloren hätte. Das Discord-Supportteam von Google Labs räumte ein, dass unerwünschte Untertitel durch Szenen mit Sprache ausgelöst werden können. Man sei sich des Problems bewusst und arbeite daran.
Aber warum besteht Veo 3 darauf, die Quatsch-Untertitel hinzuzufügen, und warum scheint es so schwierig zu sein, das Problem zu lösen? Das liegt wahrscheinlich daran, wie konkret das Modell trainiert wurde. Obwohl Google diese Informationen nicht veröffentlicht, enthalten die Trainingsdaten wahrscheinlich YouTube-Videos, Clips aus Vlogs und Gaming-Kanälen sowie deren TikTok-Edits, von denen viele mit Untertiteln versehen sind. Diese eingebetteten Untertitel sind Teil der Videobilder und keine separaten Textspuren, die darüber gelegt werden. Daher ist es schwierig, sie zu entfernen, bevor sie für das Training verwendet werden können, sagt Shuo Niu, Assistenzprofessor an der Clark University in Massachusetts, der sich mit Videoplattformen und KI beschäftigt.
Unreifes Produkt auf den Markt geworfen?
„Das Text-zu-Video-Modell wird mithilfe von Reinforcement Learning trainiert, um Inhalte zu produzieren, die von Menschen erstellte Videos imitieren. Wenn solche Videos Untertitel enthalten, kann das Modell lernen, dass die Einbindung von Untertiteln die Ähnlichkeit mit von Menschen erstellten Inhalten erhöht“, sagt der Forscher. „Wir arbeiten kontinuierlich daran, die Videogenerierung zu verbessern, insbesondere in Bezug auf Text, natürlich klingende Sprache und perfekt synchronisierten Ton“, gab ein Google-Sprecher an. „Wir empfehlen Nutzern, ihren Prompt erneut zu versuchen, wenn sie Unstimmigkeiten feststellen, und uns über die Daumen-hoch/Daumen-herunter-Option ein Feedback zu geben.“ Warum das Modell Anweisungen wie „keine Untertitel“ oft ignoriert, liegt unterdessen wohl daran, dass negative Eingaben (die einem generativen KI-Modell sagen, etwas nicht zu tun) in der Regel weniger effektiv sind als positive Prompts. Davon geht auch Tuhin Chakrabarty, Assistenzprofessor an der Stony Brook University, der sich mit KI-Systemen beschäftigt, aus.
Um das Problem zu beheben, müsste Google letztlich jedes Frame jedes Videos, mit dem Veo 3 trainiert wurde, überprüfen und diejenigen mit Untertiteln entweder entfernen oder neu kennzeichnen, bevor das Modell neu trainiert wird. Das sei ein Unterfangen, das mindestens Wochen dauern würde, sagt Chakrabarty. Katerina Cizek, Dokumentarfilmerin und künstlerische Leiterin am MIT Open Documentary Lab, meint, dass dieses Problem beispielhaft für die Bereitschaft von Google sei, Produkte auf den Markt zu werfen, bevor sie vollständig ausgereift sind. „Google brauchte hier einen Erfolg“, sagt sie. „Die mussten die Ersten sein, die ein Tool auf den Markt bringen, das lippensynchronen Ton mit Video generiert. Das war ihnen wichtiger als die Behebung des Problems mit den Untertiteln.“
Dieser Beitrag ist zuerst bei t3n.de erschienen.
(jle)
Künstliche Intelligenz
Gewinn des US-Autoherstellers General Motors bricht wegen Zöllen ein
Der US-Autohersteller General Motors (GM) verzeichnet in seinem Halbjahres-Geschäftsbericht die Auswirkungen der präsidialen Zollpolitik. So ging der Gewinn im zweiten Quartal spürbar zurück, übertraf dabei aber die noch niedrigeren Markterwartungen. Dabei half GM auch das Geschäft in China, wo der Konzern das zweite Quartal in Folge Gewinn erwirtschaftete. Das Management bestätigte heute seine Jahresziele. Für das gesamte Jahr rechnet GM weiterhin mit einer Belastung von vier bis fünf Milliarden US-Dollar durch die vom US-Präsidenten verhängten Zölle.
Für die GM-Aktie ging es kurz nach Börsenbeginn in New York um rund sieben Prozent abwärts. Der Kursrutsch machte die Gewinne aus den vergangenen Wochen zunichte, und das Papier wurde wieder zu ähnlichen Kursen gehandelt wie noch zum Jahreswechsel. Der Konzern hofft, mindestens 30 Prozent der Zölle durch Anpassungen in der Produktion und Kostensenkungen auszugleichen. Dennoch müssen sich Kunden in Nordamerika laut GM auf Preiserhöhungen um 0,5 bis 1 Prozent einstellen. Das Unternehmen hatte im Juni angekündigt, einen Teil der Produktion von Mexiko in die USA zu verlagern.
Gewinn in China, Abschreibung auf E-Autos
GM verkaufte im zweiten Quartal 974.000 Fahrzeuge und damit fast 25.000 weniger als Analysten erwartet hatten. Diese waren dafür aber teurer als gedacht – der Umsatz ging im Vergleich zum Vorjahreszeitraum zwar leicht zurück auf gut 47 Milliarden Dollar (40,3 Mrd. Euro), lag damit aber über den Erwartungen. Dabei half auch das Geschäft in China, wo der Konzern das zweite Quartal in Folge Gewinn erwirtschaftete. Zudem senkte GM die Fixkosten um 800 Millionen Dollar. Eine Abschreibung auf Elektroauto-Bestände brachte dagegen eine Belastung von 600 Millionen Dollar.
Wegen der Zölle auf im US-Ausland hergestellte Autos und Fahrzeugteile verdiente GM im Tagesgeschäft (bereinigtes Ebit) allerdings lediglich rund drei Milliarden Dollar und damit über 30 Prozent weniger als im Vorjahreszeitraum. Der auf die Aktionäre entfallene Gewinn brach sogar noch stärker ein auf knapp 1,9 Milliarden Dollar.
Mehr über die Marke Cadillac
(fpi)
Künstliche Intelligenz
Urteil: Regierung darf ihre Facebook-Fanseite betreiben
Das Bundespresseamt darf für die Bundesregierung eine Facebook-Seite betreiben und muss dabei nicht selbst dafür Sorge tragen, dass Besucher der Seite der Verarbeitung ihrer Daten zustimmen. Das hat das Verwaltungsgericht Köln am Dienstag entschieden und damit den Klagen von Meta und dem Bundespresseamt stattgegeben (Az. 13 K 1419/23).
In dem Verfahren ging es um eine Grundsatzfrage des Datenschutzrechts: Inwieweit sind Betreiber einer Facebook-Fanpage mit dafür verantwortlich, eine informierte Einwilligung der Nutzer zur Verarbeitung ihrer Daten sicherzustellen? Im Februar 2023 hatte der damalige Bundesdatenschutzbeauftragte Ulrich Kelber dem Bundespresseamt (BPA) den Betrieb der Fanpage untersagt, auch um diese Grundsatzfragen endlich gerichtlich klären zu lassen.
Ist die Bundesregierung verantwortlich?
Kelber vertrat die Ansicht, dass BPA sei als Betreiber der Seite verantwortlich und müsse nachweisen können, dass Grundsätze des Datenschutzrechts eingehalten werden. Weil es das nicht könne, erfolge der Betrieb der Facebook-Seite ohne Rechtsgrundlage und müsse eingestellt werden.
Das BPA hingegen sieht die Verantwortung für die Datenverarbeitung alleine bei Facebook und betrieb die Facebook-Seite weiter. Das Amt, das die Öffentlichkeitsarbeit der Bundesregierung organisiert, hatte gegen das Verbot schließlich Klage beim Verwaltungsgericht Köln eingereicht.
Nach einer mehrstündigen Verhandlung am vergangenen Donnerstag hatten die Richter beim Verwaltungsgericht Köln noch etwas Diskussionbedarf. Doch nun steht fest: Die Bundesregierung hat das Gerichtsverfahren gegen die Bundesdatenschutzbeauftragte in erster Instanz gewonnen und darf die Facebook-Fanpage der Bundesregierung weiterbetreiben. Gegen das Urteil ist Berufung möglich.
In der jetzt ergangenen Entscheidung folgen die Richter der Sichtweise der Bundesregierung, dass der Betrieb der Fanpage alleine noch keine Verantwortlichkeit für beim Aufruf gesetzte Cookies auslösen würde, wenn der Cookie-Banner des Betreibers datenschutzrechtlich unzureichend sei.
Keine separate Einwilligung nötig
Meta und das Bundespresseamt seien nicht dazu verpflichtet, eine separate Einwilligung – etwa mit einem zweiten Cookie-Banner – einzuholen, so das Gericht in seiner Mitteilung. Sie seien auch nicht gemeinsam für die beanstandeten Datenverarbeitungen verantwortlich, sondern ausschließlich der Betreiberkonzern. Den Text der Entscheidung selbst hat das Gericht noch nicht veröffentlicht, dies soll laut einer Sprecherin in den kommenden Tagen erfolgen.
Bei der Bundesbeauftragten für den Datenschutz wird das Urteil derzeit analysiert. „Wir begrüßen die zügige Entscheidung des VG Köln und die Zulassung der Berufung“, erklärte ein Sprecher der BfDI. „Ich werde mir die Urteilsbegründung sehr gründlich ansehen und entscheiden, ob ich die Sache der nächsthöheren Instanz, dem Oberverwaltungsgericht Münster, zur Entscheidung vorlege“, sagte die aktuelle Bundesdatenschutzbeauftragte Louisa Specht-Riemenschneider.
Regierungssprecher Stefan Kornelius, in dieser Funktion als Staatssekretär auch Leiter des Presse- und Informationsamts der Bundesregierung, sieht die Haltung der Regierung und seines Amtsvorgängers durch das Urteil aus Köln bestätigt. Die Bundesregierung müsse der Mediennutzung der Menschen entsprechend Informationsangebote unterbreiten können. Als Einverständnis mit möglicherweise rechtswidrigen Betreiberpraktiken will Kornelius eine Präsenz der Bundesregierung in Form einer Facebook-Fanpage nicht verstanden wissen. „Auf Sozialen Medien aktiv zu sein, bedeutet überdies nicht, sich mit allen Einzelheiten der Geschäfts- und Datenschutzpraxis der jeweiligen Unternehmen einverstanden zu erklären“, so der von Friedrich Merz im Mai ernannte Regierungssprecher. „Im Gegenteil: Wir setzen uns als Bundespresseamt für eine möglichst datenschutzfreundliche Ausgestaltung der Sozialen Medien ein.“
Update
22.07.2025,
18:25
Uhr
Stellungnahme des Regierungssprechers ergänzt.
(vbr)
Künstliche Intelligenz
Vorstellung Opel Mokka GSE: Kleines E-SUV mit reichlich Kraft
Die zurückliegende Modellpflege des Opel Mokka fiel erstaunlich sparsam aus. Also müssen andere Anreize her, um das kleine SUV weiter im Gespräch zu halten. Die Plattform-Strategie des Vielmarken-Verbundes Stellantis macht ein Upgrade vergleichsweise einfach. Der Opel Mokka GSE bekommt den Antriebsstrang des Alfa Romeo Elettrica.
Flache Flanke
Äußerlich müssen es ein paar Umformungen vorn und hinten, gelbe Bremssättel sowie Planken an den Seiten mit großem GSE-Schriftzug richten, das Sport- von den normalen Modellen abzugrenzen. Prägend ist eine Rad-Reifen-Kombination, deren Flankenhöhe fast auf ein absolutes Minimalmaß heruntergefahren wurde. Michelin-Pneus im Format 225/40 R20 montiert Opel rundherum. Im Innenraum bekommt der Mokka GSE Sportsitze und etwas Alcantara, dazu ein Display mit erweiterten Darstellungsoptionen.
225/40 R20 – viel Flankenhöhe verbleibt hier nicht mehr.
(Bild: Opel)
Der Antrieb leistet 206 kW und bietet 345 Nm Drehmoment. Trotz eines Leergewichts von rund 1,6 Tonnen soll das E-SUV in 5,9 Sekunden aus dem Stand 100 km/h erreichen. Schluss ist erst bei 200 km/h. Da auf dieser Plattform kein Allradantrieb vorgesehen ist, wird die gesamte Leistung allein über die Vorderräder übertragen. Viele Hersteller versuchen, mit Bremseingriffen der Lage Herr zu werden – Stellantis leistet sich ein Torsen-Sperrdifferenzial.
Dreiphasenlader serienmäßig?
Unverändert bleibt die Energieversorgung. Die Batterie hat 54 kWh brutto, von denen sich 51 kWh nutzen lassen. Die maximale Ladeleistung liegt bei 100 kW. An Wechselstrom sind bis zu 11 kW möglich. Während diese Zeilen entstehen, stammt die aktuelle Preisliste vom 23. Oktober 2024, der GSE ist also noch nicht enthalten. Vielleicht nutzt Opel die Gelegenheit, ein dreiphasiges Ladegerät mit 11 kW endlich serienmäßig unterzubringen. Wer nicht 700 Euro Aufpreis akzeptiert, lädt an Wechselstrom einphasig mit maximal 7,4 kW.
Sportsitze, etwas Alcantara und weitere Optionen für die Darstellung auf dem Display grenzen den GSE von den anderen Mokka-Modellen ab.
(Bild: Opel)
Das ist schon eine tapfere Ansage, zumal der Mokka Electric mit einem Basispreis von 36.740 Euro ohnehin vergleichsweise teuer ist. Sollte Opel bei dieser selbstbewussten Kalkulation bleiben, werden wohl, ähnlich wie beim Alfa Romeo, an die 50.000 Euro fällig. Bei diesem Kurs für ein 4,15 Meter kurzes E-SUV kann sich der Interessent zumindest sicher sein, ein recht exklusives Modell zu bekommen.
Noch nennt Opel keine Preise für den Mokka GSE. Mit knapp 50.000 Euro darf gerechnet werden.
(Bild: Opel)
Lesen Sie mehr zur Marke Opel
(mfz)
-
Datenschutz & Sicherheitvor 1 Monat
Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken
-
Online Marketing & SEOvor 1 Monat
TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings
-
Apps & Mobile Entwicklungvor 1 Monat
Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen
-
Digital Business & Startupsvor 4 Wochen
80 % günstiger dank KI – Startup vereinfacht Klinikstudien: Pitchdeck hier
-
UX/UI & Webdesignvor 1 Monat
Philip Bürli › PAGE online
-
Apps & Mobile Entwicklungvor 4 Wochen
Patentstreit: Western Digital muss 1 US-Dollar Schadenersatz zahlen
-
Social Mediavor 1 Monat
LinkedIn Feature-Update 2025: Aktuelle Neuigkeiten
-
Social Mediavor 1 Monat
Aktuelle Trends, Studien und Statistiken