Künstliche Intelligenz
Googles Veo 3 erstellt geniale Videos – aber die Untertitel sind völlig verrückt
Nachdem Google Ende Mai sein neuestes KI-Modell zur Videogenerierung vorgestellt hatte, stürzten sich Kreative darauf, um es auf Herz und Nieren zu testen. Nur wenige Monate nach der Verfügbarmachung seines Vorgängers ermöglicht Veo 3 Nutzern erstmals die Generierung von Klängen und Dialogen, was zu einer Flut hyperrealistischer maximal achtsekündiger Clips führte, die dann zu Werbespots, ASMR-Videos, imaginären Filmtrailern oder humorvollen Fake-Straßeninterviews zusammengeschnitten wurden. Der Oscar-nominierte Regisseur Darren Aronofsky nutzte das Tool gar, um einen Kurzfilm mit dem Titel „Ancestra“ zu erstellen. Während einer Google-Pressekonferenz verglich Demis Hassabis, CEO der Google-KI-Tochter DeepMind, diesen Sprung nach vorne mit dem „Ende der Stummfilmära in der Videogenierung“.
Einige Nutzer stellten jedoch schnell fest, dass das Tool keineswegs perfekt war und in mancher Hinsicht nicht wie erwartet arbeitete. Denn: Wenn Veo 3 Clips mit Dialogen generiert, fügt es oft unsinnige, verstümmelte Untertitel hinzu, selbst wenn in den Eingabeaufforderungen ausdrücklich angegeben wurde, das zu unterlassen. Die Nonsens-Untertitel zu entfernen, ist aber nicht einfach – und auch nicht billig. Nutzer sind nämlich gezwungen, Clips neu generieren zu lassen (was sie mehr Geld kostet) – in der Hoffnung, dass es nicht wieder passiert. Alternativ müssen sie externe Tools zum Entfernen von Untertiteln verwenden oder ihre Videos störend zuschneiden, um die Untertitel vollständig zu entfernen.
Google seit mehr als einem Monat informiert
Josh Woodward, Vizepräsident von Google Labs und Gemini, veröffentlichte schon am 9. Juni auf X den Hinweis, dass Google Korrekturmaßnahmen ergriffen habe, um die Ausgabe der unsinnigen Untertitel zu reduzieren. Aber auch über einen Monat später melden Nutzer immer noch Probleme damit im offiziellen Discord-Kanal von Google Labs, ohne dass sie Hilfe bekommen. Das zeigt, wie offenkundig schwierig es sein kann, Fehler in großen KI-Modellen, Bild- und Videogenratoren zu beheben.
Wie seine Vorgänger ist Veo 3 für zahlende Mitglieder größerer Google-Abonnementstufen verfügbar, die nicht billig sind: Es geht bei 249,99 US-Dollar pro Monat erst los. Um einen achtsekündigen Clip zu erstellen, geben Nutzer einen Prompt in Googles KI-Filmtool Flow, in Gemini oder andere Google-KI-Plattformen ein, der die Szene beschreibt, die sie erstellen möchten. Doch das Abo allein reicht nicht: Jede Veo-3-Videogenerierung kostet mindestens 20 KI-Credits, die 25 US-Dollar pro 2.500 Credits kosten. Mona Weiss, Kreativdirektorin in der Werbebranche, erzählt, dass das Neugenerieren von Szenen, um die quatschigen Untertitel loszuwerden, schnell teuer wird. „Wenn man eine Szene mit Dialogen erstellt, haben bis zu 40 Prozent der Ausgaben diese unverständlichen Untertitel, die sie dann unbrauchbar machen“, sagt sie. „Man verbrennt also Geld, um eine Szene zu erhalten, die einem gefällt, aber dann kann man sie letztlich nicht einmal verwenden.“
Credits futsch, teures Abo zahlt man obendrein
Als Weiss das Problem über den Discord-Kanal an Google Labs meldete, in der Hoffnung, eine Rückerstattung für ihre verschwendeten Credits zu erhalten, verwies das dortige Team sie nur an den offiziellen Support des Unternehmens. Dieser bot ihr nur eine Rückerstattung der Kosten für Veo 3 an, jedoch nicht für die Credits. Weiss lehnte das ab, da sie damit den Zugriff auf die Videogenerierung vollständig verloren hätte. Das Discord-Supportteam von Google Labs räumte ein, dass unerwünschte Untertitel durch Szenen mit Sprache ausgelöst werden können. Man sei sich des Problems bewusst und arbeite daran.
Aber warum besteht Veo 3 darauf, die Quatsch-Untertitel hinzuzufügen, und warum scheint es so schwierig zu sein, das Problem zu lösen? Das liegt wahrscheinlich daran, wie konkret das Modell trainiert wurde. Obwohl Google diese Informationen nicht veröffentlicht, enthalten die Trainingsdaten wahrscheinlich YouTube-Videos, Clips aus Vlogs und Gaming-Kanälen sowie deren TikTok-Edits, von denen viele mit Untertiteln versehen sind. Diese eingebetteten Untertitel sind Teil der Videobilder und keine separaten Textspuren, die darüber gelegt werden. Daher ist es schwierig, sie zu entfernen, bevor sie für das Training verwendet werden können, sagt Shuo Niu, Assistenzprofessor an der Clark University in Massachusetts, der sich mit Videoplattformen und KI beschäftigt.
Unreifes Produkt auf den Markt geworfen?
„Das Text-zu-Video-Modell wird mithilfe von Reinforcement Learning trainiert, um Inhalte zu produzieren, die von Menschen erstellte Videos imitieren. Wenn solche Videos Untertitel enthalten, kann das Modell lernen, dass die Einbindung von Untertiteln die Ähnlichkeit mit von Menschen erstellten Inhalten erhöht“, sagt der Forscher. „Wir arbeiten kontinuierlich daran, die Videogenerierung zu verbessern, insbesondere in Bezug auf Text, natürlich klingende Sprache und perfekt synchronisierten Ton“, gab ein Google-Sprecher an. „Wir empfehlen Nutzern, ihren Prompt erneut zu versuchen, wenn sie Unstimmigkeiten feststellen, und uns über die Daumen-hoch/Daumen-herunter-Option ein Feedback zu geben.“ Warum das Modell Anweisungen wie „keine Untertitel“ oft ignoriert, liegt unterdessen wohl daran, dass negative Eingaben (die einem generativen KI-Modell sagen, etwas nicht zu tun) in der Regel weniger effektiv sind als positive Prompts. Davon geht auch Tuhin Chakrabarty, Assistenzprofessor an der Stony Brook University, der sich mit KI-Systemen beschäftigt, aus.
Um das Problem zu beheben, müsste Google letztlich jedes Frame jedes Videos, mit dem Veo 3 trainiert wurde, überprüfen und diejenigen mit Untertiteln entweder entfernen oder neu kennzeichnen, bevor das Modell neu trainiert wird. Das sei ein Unterfangen, das mindestens Wochen dauern würde, sagt Chakrabarty. Katerina Cizek, Dokumentarfilmerin und künstlerische Leiterin am MIT Open Documentary Lab, meint, dass dieses Problem beispielhaft für die Bereitschaft von Google sei, Produkte auf den Markt zu werfen, bevor sie vollständig ausgereift sind. „Google brauchte hier einen Erfolg“, sagt sie. „Die mussten die Ersten sein, die ein Tool auf den Markt bringen, das lippensynchronen Ton mit Video generiert. Das war ihnen wichtiger als die Behebung des Problems mit den Untertiteln.“
Dieser Beitrag ist zuerst bei t3n.de erschienen.
(jle)
Künstliche Intelligenz
AWS-Ausfall machte vernetzte Matratzen unbrauchbar
Montagmorgen kam es in einem Amazon-Rechenzentrum im US-Staat Virginia zu einer Störung. Schuld waren Probleme mit dem Domain Name System (DNS). Die Auswirkungen der „erhöhten Fehlerraten und Latenzen bei den AWS Services in der US-EAST-1-Region“ waren weltweit zu spüren. Zahlreiche Internet-Dienste ließen sich zeitweise nur eingeschränkt oder gar nicht nutzen. Darunter auch Matratzen.
Weiterlesen nach der Anzeige
Das belegen Beschwerden diverser Kunden der New Yorker Firma Eight Sleep. Sie verkauft unter der Bezeichnung „Pod“ vernetzte Matratzen, die irreführend als „smart“ bezeichnet werden. Diese Schlafunterlagen zeichnen sich durch ihren hohen Preis aus. In Deutschland geht es bei 2.849 Euro für die Matratze los, zuzüglich mindestens 17 Euro für das monatliche „Autopilot“-Abonnement, gerne nimmt Eight Sleep auch 33 Euro monatlich. Dafür erhält der Schläfer statistische Auswertungen, eingebaute Heizung und Kühlung, sowie einen Motor, der bestimmte Bereiche der Matratze verformen kann. Damit können Bettbenutzer im Bett beispielsweise besser sitzen.
Was im Preis bislang nicht inbegriffen ist, ist ein Offline-Modus der Matratze. Als das AWS-Rechenzentrum in Virginia ausfiel, betraf das auch die Matratzen-Server Eight Sleeps. Damit wurde die Steuerapplikation der Matratzen funktionslos. Wer seine Matratze aufgerichtet hatte, konnte sie und damit sich selbst nicht mehr flachlegen. Auch die Kühlung konnte nicht aktiviert werden, womit manchen Müden die Nacht zu heiß wurde.
Gleichermaßen blieb die etwaig aktivierte Matratzenheizung auf dem eingestellten Heizniveau stecken, was ebenfalls Beschwerdepostings in Sozialen Netzen zur Folge hatte. Warum die überhitzten Schlafwilligen ihrer Matratze nicht einfach den Stecker gezogen haben, erklären sie nicht.
Dafür erklärt der Chef der Firma Eight Sleep sein Bedauern und verspricht, rund um die Uhr an einem Offline-Modus arbeiten zu lassen. Die Matratzen-Innovation kennt kein Ende!
(ds)
Künstliche Intelligenz
Meta Platforms kündigt 600 KI-Spezialisten
Meta Platforms streicht ungefähr 600 Arbeitsplätze in der KI-Abteilung. Dabei geht es aber offenbar weniger um Einsparungen, sondern mehr um Entschlackung. Wer bleibt, muss härter arbeiten. Seit etwa drei Jahren hat Meta für seine „Superintelligence Labs“ KI auf Teufel komm raus Personal eingestellt, in Summe laut Medienberichten rund 3.000 Menschen. Das Ergebnis ist nicht unbedingt effizient.
Weiterlesen nach der Anzeige
„Indem wir die Größe unserer Mannschaft reduzieren, werden weniger Gespräche notwendig sein, um Entscheidungen zu treffen“, zitiert die New York Times aus einem internen Rundschreiben Meta Platforms‘ vom Mittwoch. „Jede Person wird mehr Last tragen, mehr Zuständigkeit und mehr Einfluss haben.“ Die vom Stellenabbau Betroffenen sind noch am Mittwoch verständigt worden. Laut dem Rundschreiben wird der Datenkonzern versuchen, ihnen andere Stellen im Unternehmen anzubieten.
Metas Superintelligence Labs haben vier Bereiche. In dreien wird Mitarbeitern gekündigt: bei der KI-Forschung (FAIR), bei der KI-Infrastruktur und bei der Produktentwicklung. Nicht betroffen von dem Stellenabbau ist laut dem Rundschreiben jene Sparte, die sich tatsächlich mit Superintelligence befasst und zudem Metas Große Sprachmodelle (LLMs) managt. Letztere treiben Chatbots bei Facebook, Messenger, Whatsapp, Instagram und Threads.
Wider die Bürokratie und die Konkurrenz
Der Einschnitt bei der KI-Belegschaft soll nicht als Rückzug oder Zurechtstutzung der teuren KI-Bemühungen Metas verstanden werden, haben Manager durchblicken lassen. Vielmehr soll Bürokratie abgebaut und so die KI-Weiterentwicklung beschleunigt werden.
Meta fürchtet, im Wettstreit mit anderen Datenkonzernen ins Hintertreffen zu gelangen. Dazu passt, dass Meta fremde Chatbots, darunter ChatGPT, aus Whatsapp verbannen wird. Diese Maßnahme soll im kommenden Jahr umgesetzt werden. Im Juni hat Meta 14,3 Milliarden Dollar für eine Minderheitsbeteiligung am Start-up Scale AI gezahlt.
(ds)
Künstliche Intelligenz
Urteile: Auch Aldi Nord und Edeka müssen Elektroschrott gratis zurücknehmen
Auf die Pflicht zur kostenlosen Rücknahme von Elektro-Altgeräten pochen neue Gerichtsentscheidungen in Deutschland. Das festigt die Auslegung der Reform des Elektro- und Elektronikgerätegesetzes (ElektroG). So bestätigen zwei aktuelle Urteile von Landgerichten, dass Elektrogeräte verkaufende Einzelhändler ab einer gewissen Ladengröße ausgediente Elektrokleingeräte wieder annehmen müssen. Und das gebührenfrei.
Weiterlesen nach der Anzeige
Konkret richtet sich eine entsprechende Entscheidung des Landgerichts Verden gegen Aldi Nord (Az. 9 O 25/25). Das Landgericht Würzburg wiederum hat einen Edeka-Verbrauchermarkt zur Rücknahme verdonnert (Az. 2 HK O 1330/25). Der Text der Entscheidungen ist bislang nicht veröffentlicht worden. In beiden Fällen ist die Deutsche Umwelthilfe (DUH) gegen die Händler vorgegangen. Testbesucher hatten Verstöße gegen die seit über drei Jahren geltende Rücknahmepflicht festgestellt.
Mit dem ElektroG werden Lebensmittelhändler, Supermärkte und Discounter mit einer Verkaufsfläche von mindestens 800 Quadratmetern dazu verpflichtet, elektronische Apparate wie Rasierer, Mobiltelefone oder Powerbanks kostenlos zurückzunehmen, wenn sie elektronische Geräte feilbieten. Bis zu einer Kantenlänge von 25 Zentimetern hängt das Rückgaberecht nicht davon ab, ob die Kunden ein neues Gerät kaufen.
Die aktuelle Rechtsprechung steht im Einklang mit früheren Entscheidungen, die die Reichweite des ElektroG und die Pflichten von Großvertreibern untermauern. Ein prominentes Beispiel dafür ist das Urteil des Oberlandesgerichts Hamm vom 11. März, das die Rücknahmepflicht von Großhändlern – im konkreten Fall von Lidl – bestätigt. Diese Urteile verdeutlichen, dass die einschlägige Vorgabe auch für Lebensmittel- und Drogeriemärkte gilt und nicht auf reine Elektronikfachgeschäfte beschränkt ist. Verweise von Lidl auf das weniger weitgehende EU-Recht oder die potenzielle Verfassungswidrigkeit der Norm ließen die Hammer Richter nicht gelten.
Kritik an mangelhafter Umsetzung
Die Bundesgeschäftsführerin der DUH, Barbara Metz, betont, dass die fortlaufenden Klagen die unzureichende Einhaltung der gesetzlichen Bestimmungen durch den Handel aufzeigen würden. Sie sei ein wesentlicher Grund dafür, dass Deutschland die gesetzlich vorgeschriebene Sammelquote für Elektroaltgeräte von 65 Prozent weit verfehle und lediglich auf 29,5 Prozent komme.
Metz fordert die Händler, insbesondere Supermärkte und Drogerien, auf, ihrer Produktverantwortung nachzukommen. Schließlich generierten sie durch den Verkauf von Elektrogeräten auch Einnahmen. Die DUH appelliert an die Unternehmen, die Rücknahme offensiv zu bewerben und feuersichere Sammelbehälter bereitzustellen.
Weiterlesen nach der Anzeige
Da die Behörden der Länder die Rücknahmepflicht nach Ansicht der DUH unzureichend kontrollieren, plant die Organisation weitere Testbesuche und gegebenenfalls Klagen. Die fachgerechte Sammlung und das Recycling von Elektroaltgeräten seien essenziell, um Ressourcen zu schonen, die Freisetzung von Schadstoffen zu verhindern und Brandrisiken der Akkus zu minimieren. Mit Probeläufen in 21 Supermärkten und Drogerien hat die DUH jüngst aufgedeckt, dass in knapp der Hälfte der Filialen kein Elektroschrott abgegeben werden konnte.
(ds)
-
UX/UI & Webdesignvor 2 Monaten
Der ultimative Guide für eine unvergessliche Customer Experience
-
UX/UI & Webdesignvor 2 Monaten
Adobe Firefly Boards › PAGE online
-
Social Mediavor 2 Monaten
Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist
-
Entwicklung & Codevor 2 Monaten
Posit stellt Positron vor: Neue IDE für Data Science mit Python und R
-
Entwicklung & Codevor 2 Monaten
EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events
-
UX/UI & Webdesignvor 1 Monat
Fake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online
-
UX/UI & Webdesignvor 5 Tagen
Illustrierte Reise nach New York City › PAGE online
-
Apps & Mobile Entwicklungvor 3 Monaten
Firefox-Update 141.0: KI-gestützte Tab‑Gruppen und Einheitenumrechner kommen