Künstliche Intelligenz
Googles Veo 3 erstellt geniale Videos – aber die Untertitel sind völlig verrückt
Nachdem Google Ende Mai sein neuestes KI-Modell zur Videogenerierung vorgestellt hatte, stürzten sich Kreative darauf, um es auf Herz und Nieren zu testen. Nur wenige Monate nach der Verfügbarmachung seines Vorgängers ermöglicht Veo 3 Nutzern erstmals die Generierung von Klängen und Dialogen, was zu einer Flut hyperrealistischer maximal achtsekündiger Clips führte, die dann zu Werbespots, ASMR-Videos, imaginären Filmtrailern oder humorvollen Fake-Straßeninterviews zusammengeschnitten wurden. Der Oscar-nominierte Regisseur Darren Aronofsky nutzte das Tool gar, um einen Kurzfilm mit dem Titel „Ancestra“ zu erstellen. Während einer Google-Pressekonferenz verglich Demis Hassabis, CEO der Google-KI-Tochter DeepMind, diesen Sprung nach vorne mit dem „Ende der Stummfilmära in der Videogenierung“.
Einige Nutzer stellten jedoch schnell fest, dass das Tool keineswegs perfekt war und in mancher Hinsicht nicht wie erwartet arbeitete. Denn: Wenn Veo 3 Clips mit Dialogen generiert, fügt es oft unsinnige, verstümmelte Untertitel hinzu, selbst wenn in den Eingabeaufforderungen ausdrücklich angegeben wurde, das zu unterlassen. Die Nonsens-Untertitel zu entfernen, ist aber nicht einfach – und auch nicht billig. Nutzer sind nämlich gezwungen, Clips neu generieren zu lassen (was sie mehr Geld kostet) – in der Hoffnung, dass es nicht wieder passiert. Alternativ müssen sie externe Tools zum Entfernen von Untertiteln verwenden oder ihre Videos störend zuschneiden, um die Untertitel vollständig zu entfernen.
Google seit mehr als einem Monat informiert
Josh Woodward, Vizepräsident von Google Labs und Gemini, veröffentlichte schon am 9. Juni auf X den Hinweis, dass Google Korrekturmaßnahmen ergriffen habe, um die Ausgabe der unsinnigen Untertitel zu reduzieren. Aber auch über einen Monat später melden Nutzer immer noch Probleme damit im offiziellen Discord-Kanal von Google Labs, ohne dass sie Hilfe bekommen. Das zeigt, wie offenkundig schwierig es sein kann, Fehler in großen KI-Modellen, Bild- und Videogenratoren zu beheben.
Wie seine Vorgänger ist Veo 3 für zahlende Mitglieder größerer Google-Abonnementstufen verfügbar, die nicht billig sind: Es geht bei 249,99 US-Dollar pro Monat erst los. Um einen achtsekündigen Clip zu erstellen, geben Nutzer einen Prompt in Googles KI-Filmtool Flow, in Gemini oder andere Google-KI-Plattformen ein, der die Szene beschreibt, die sie erstellen möchten. Doch das Abo allein reicht nicht: Jede Veo-3-Videogenerierung kostet mindestens 20 KI-Credits, die 25 US-Dollar pro 2.500 Credits kosten. Mona Weiss, Kreativdirektorin in der Werbebranche, erzählt, dass das Neugenerieren von Szenen, um die quatschigen Untertitel loszuwerden, schnell teuer wird. „Wenn man eine Szene mit Dialogen erstellt, haben bis zu 40 Prozent der Ausgaben diese unverständlichen Untertitel, die sie dann unbrauchbar machen“, sagt sie. „Man verbrennt also Geld, um eine Szene zu erhalten, die einem gefällt, aber dann kann man sie letztlich nicht einmal verwenden.“
Credits futsch, teures Abo zahlt man obendrein
Als Weiss das Problem über den Discord-Kanal an Google Labs meldete, in der Hoffnung, eine Rückerstattung für ihre verschwendeten Credits zu erhalten, verwies das dortige Team sie nur an den offiziellen Support des Unternehmens. Dieser bot ihr nur eine Rückerstattung der Kosten für Veo 3 an, jedoch nicht für die Credits. Weiss lehnte das ab, da sie damit den Zugriff auf die Videogenerierung vollständig verloren hätte. Das Discord-Supportteam von Google Labs räumte ein, dass unerwünschte Untertitel durch Szenen mit Sprache ausgelöst werden können. Man sei sich des Problems bewusst und arbeite daran.
Aber warum besteht Veo 3 darauf, die Quatsch-Untertitel hinzuzufügen, und warum scheint es so schwierig zu sein, das Problem zu lösen? Das liegt wahrscheinlich daran, wie konkret das Modell trainiert wurde. Obwohl Google diese Informationen nicht veröffentlicht, enthalten die Trainingsdaten wahrscheinlich YouTube-Videos, Clips aus Vlogs und Gaming-Kanälen sowie deren TikTok-Edits, von denen viele mit Untertiteln versehen sind. Diese eingebetteten Untertitel sind Teil der Videobilder und keine separaten Textspuren, die darüber gelegt werden. Daher ist es schwierig, sie zu entfernen, bevor sie für das Training verwendet werden können, sagt Shuo Niu, Assistenzprofessor an der Clark University in Massachusetts, der sich mit Videoplattformen und KI beschäftigt.
Unreifes Produkt auf den Markt geworfen?
„Das Text-zu-Video-Modell wird mithilfe von Reinforcement Learning trainiert, um Inhalte zu produzieren, die von Menschen erstellte Videos imitieren. Wenn solche Videos Untertitel enthalten, kann das Modell lernen, dass die Einbindung von Untertiteln die Ähnlichkeit mit von Menschen erstellten Inhalten erhöht“, sagt der Forscher. „Wir arbeiten kontinuierlich daran, die Videogenerierung zu verbessern, insbesondere in Bezug auf Text, natürlich klingende Sprache und perfekt synchronisierten Ton“, gab ein Google-Sprecher an. „Wir empfehlen Nutzern, ihren Prompt erneut zu versuchen, wenn sie Unstimmigkeiten feststellen, und uns über die Daumen-hoch/Daumen-herunter-Option ein Feedback zu geben.“ Warum das Modell Anweisungen wie „keine Untertitel“ oft ignoriert, liegt unterdessen wohl daran, dass negative Eingaben (die einem generativen KI-Modell sagen, etwas nicht zu tun) in der Regel weniger effektiv sind als positive Prompts. Davon geht auch Tuhin Chakrabarty, Assistenzprofessor an der Stony Brook University, der sich mit KI-Systemen beschäftigt, aus.
Um das Problem zu beheben, müsste Google letztlich jedes Frame jedes Videos, mit dem Veo 3 trainiert wurde, überprüfen und diejenigen mit Untertiteln entweder entfernen oder neu kennzeichnen, bevor das Modell neu trainiert wird. Das sei ein Unterfangen, das mindestens Wochen dauern würde, sagt Chakrabarty. Katerina Cizek, Dokumentarfilmerin und künstlerische Leiterin am MIT Open Documentary Lab, meint, dass dieses Problem beispielhaft für die Bereitschaft von Google sei, Produkte auf den Markt zu werfen, bevor sie vollständig ausgereift sind. „Google brauchte hier einen Erfolg“, sagt sie. „Die mussten die Ersten sein, die ein Tool auf den Markt bringen, das lippensynchronen Ton mit Video generiert. Das war ihnen wichtiger als die Behebung des Problems mit den Untertiteln.“
Dieser Beitrag ist zuerst bei t3n.de erschienen.
(jle)
Künstliche Intelligenz
Tiere an heimischen Gewässern: c’t Fotografie 5/25
Der Naturfotograf Tobias Richter begleitet Sie in seinem Beitrag in der neuen Ausgabe der c’t Fotografie 05/2025 an heimische Bachläufe und teilt seinen langjährigen Erfahrungsschatz, den er unter anderem im Erz- und Elbsandsteingebirge gesammelt hat. Er erläutert, wie es Ihnen gelingt, scheue Bewohner wie Eisvogel, Wasseramsel oder Biber erfolgreich abzulichten. Diese anspruchsvolle Disziplin richte sich primär an fortgeschrittene Fotografen oder ambitionierte Einsteiger, die bereit sind, einen hohen Zeitaufwand zu betreiben. Richters Rat: Eignen Sie sich zunächst theoretisches Wissen über den Lebensraum an und vertiefen Sie dieses durch eigene Beobachtungen bei Exkursionen.
Richter gibt konkrete Tipps zur Wahl des zu Ihrer Bildidee passenden Gewässers. Für weit verbreitete Arten wie dem Graureiher empfiehlt er, touristisch wenig frequentierte Orte aufzusuchen. Steht hingegen die Ästhetik der Bachlandschaft im Vordergrund, lohnt sich die Recherche nach besonders reizvollen Flussabschnitten. Wollen Sie dagegen seltene Spezies aufspüren, helfen Verbreitungskarten und regionale Naturführer. Der Fotograf appelliert an den Respekt vor der Natur und mahnt, die Tiere nicht zu stören und stets ausreichend Abstand zu wahren. So können Sie deren Verhaltensweisen zunächst aus sicherer Entfernung mit einem Fernglas studieren.
Heimische Gewässer sind der Lebensraum einer Vielzahl von Tieren. Mit der richtigen Vorbereitung bekommt man auch scheue Tiere wie den Eisvogel vor die Kamera.
Um die Nähe zu den Tieren, die Sie für gelungene Aufnahmen benötigen, zu erhalten, ist eine gute Tarnung unerlässlich. Richter rät dazu, dass Sie sich zuerst über lokale Vorschriften informieren und gegebenenfalls die Genehmigung des Grundstückseigentümers einzuholen, bevor Sie ein Tarnzelt aufbauen. Ziel der Tarnung ist es, Bewegungen zu kaschieren und die eigene Silhouette aufzulösen. Detailliert geht der Autor auf die Bedeutung des Lichts ein. Er erklärt, welches Licht sich für welche Aufnahmen eignet, je nachdem, ob Sie dramatische Effekte, eine ebenmäßige Ausleuchtung oder eine plastische Modellierung wünschen. Für eine harmonische Bildkomposition legt er Einsteigern den Goldenen Schnitt nahe und empfiehlt moderne spiegellose Vollformatkameras, deren Tieraugen-Autofokus die Schärfenachführung erheblich erleichtert, sowie lichtstarke Teleobjektive mit Brennweiten zwischen 400 und 800 Millimetern.
Weitere Themen der Ausgabe
Das Inhaltsverzeichnis der c’t Fotografie 5/25
Das Geheimnis der perfekten Belichtung. In ihrem Beitrag widmet sich Sandra Petrowitz dem fundamentalen Thema der Belichtung. Sie hat bemerkt, dass Fragen zur „richtigen Belichtung“ ein Dauerthema in Workshops und auf Fotoreisen sind. Selbst erfahrene Fotografen sind oft unsicher, welche Prozesse bei der kamerainternen Belichtungsmessung genau ablaufen. Der Artikel erklärt die unterschiedlichen Belichtungsmethoden und beantwortet die zentrale Frage, wann und wie Fotografen gezielt in die Automatik eingreifen sollten. Die „perfekte Belichtung“ ist nicht nur ein Zusammenspiel verschiedener Faktoren, sondern oft auch ein wohlüberlegter Kompromiss und fundiertes Wissen darüber erleichtert den fotografischen Alltag entscheidend.
Von Handarbeit zu High-Tech: Die Pioniere des Objektivbaus. Bernd Kieckhöfel wirft einen Blick auf die Entwicklungsgeschichte des Objektivbaus. Er erklärt, warum die ersten fotografischen Objektive noch mit erheblichen Abbildungsfehlern behaftet waren. Der Weg zu den heute bekannten, hervorragend korrigierten und kontrastreichen Optiken war lang und von bahnbrechenden Innovationen geprägt. Optiker führten die Berechnungen früher von Hand durch und die Linsen wurden in mühevoller Präzisionsarbeit geschliffen. Kieckhöfel stellt diese Pioniere und ihre Erfindungen vor und nimmt Sie mit auf eine spannende Reise durch die technische Geschichte Ihrer Objektive.

Portfolio Peter Franck
Feuerwerke der Erde: Vulkane fotografisch einfangen. Die Astrofotografin Katja Seidel nimmt die Leser mit auf ihre Reise nach Süditalien, wo sie sich einen langgehegten Traum verwirklicht hat: aktive Vulkane zu fotografieren – hier den Stromboli und den Ätna. Der Stromboli, bekannt für seine beständige Aktivität, verspricht eine hohe Planungssicherheit und da auch der Ätna auf Sizilien zu regelmäßigen Ausbrüchen neigt, wurde er in die Reiseroute mit aufgenommen. Die Reise fand Ende Mai 2025 statt, gezielt zur Neumondphase, um den Nachthimmel optimal nutzen zu können. So entstanden auch Vulkanfotos mit der Milchstraße darüber.
Entdeckung der Langsamkeit: Der Urlaub mit der analogen Kamera. Tobias Müller, ein leidenschaftlicher Analogfotograf, plädiert in seinem Artikel für bewusstes Entschleunigen durch analoge Fotografie im Urlaub. Er beschreibt, wie sie ihm half, die Umgebung bewusster wahrzunehmen und überlegter auszulösen. Gerade Reisen sind einmalige Erfahrungen, die eine besondere Dokumentation verdienen. Müller beschreibt das intensive Erleben des Moments, gerade, weil der Blick nicht auf ein Display fixiert ist. Der Augenblick, in dem man die entwickelten Abzüge oder Negative dann erstmals in Händen hält, ist für ihn von einer besonderen Magie. Dabei verschweigt Müller keineswegs die praktischen Herausforderungen und gibt zudem wertvolle Tipps für das Reisen mit analoger Ausrüstung und Filmmaterial.
Sie erhalten die aktuelle Ausgabe der c’t Fotografie (5/2025) für 12,90 Euro im heise shop. Dort sehen Sie auch eine komplette Inhaltsübersicht und erhalten Informationen über das exklusive Online-Zusatzmaterial, das wir über eine übersichtlich gestaltete Bedienoberfläche anbieten, dazu Vorschaubilder und das Editorial. Das ePaper und die Ausgabe für Amazon Kindle kosten jeweils 12,49 Euro.
Tipp: Jeden Samstag versenden wir unseren Newsletter. Er enthält zusätzliche Geschichten, Anregungen und Informationen rund um die Fotografie – Anmeldung hier.
(tho)
Künstliche Intelligenz
Schlaue Kochtöpfe, Dampfschubladen und Outdoor-Küchen
Der schlaue Kühlschrank mit Display und Kamera ist inzwischen ein Running Gag, der smarte Herd, der Rezepte befolgt, ein alter Hut. Neu sind auf null Grad Celsius regelbare Schubladen für Gemüse, Fisch oder das Fleisch im Kühlschrank. Bei Samsung kann man zusätzlich das Einlegedatum eingeben und der Kühlschrank sagt dann Bescheid, wenn das Gut abzulaufen droht. Da wären wir also wieder beim intelligenten Kühlschrank …
Schlaue Schubladen
Man findet auf der IFA aber auch andere Neuheiten, darunter die Dampfschublade, die für kleine Küchen gedacht ist. Die Dampfgarer in der Schublade passen ideal unter den Backofen an die Stelle, in der bei vielen hinter einer Klappe zusätzliche Backbleche, das Nudelholz oder anderes wenig genutztes Zubehör verschwindet. Man kann die 14 Zentimeter hohen Dampfschubladen aber auch an einer beliebigen anderen Stelle in der Küche einbauen, denn sie funktionieren komplett autark.
Die Schublade hat keinen hervorstehenden Griff, sondern öffnet sich auf Druck auf die Front.
Nachdem man das gewünschte Gargut in die Schublade gelegt hat, wählt man am Touchdisplay Temperatur und Zeit aus, muss dann nur noch Wasser in einen kleinen Behälter füllen und die Schublade schließen. Alternativ bieten die Schubladen diverse Automatikprogramme an, bei Siemens sind es beispielsweise fünf zum Auftauen, Einmachen oder Gehen des Kuchenteigs. Weitere Presets finden sich in der zugehörigen App, bei Miele bis zu 100 Stück. Nach der passenden Zeit meldet die Schublade respektive die App Vollzug, das Gerät schaltet sich automatisch ab und das Gemüse oder der Fisch ist zum Verzehr bereit.
Mieles 14 Liter fassende Dampfschublade kann mit Einsätzen in zwei Fächer geteilt werden. Die Schubladen von Bosch und Siemens bestehen aus einem großen Fach.
Bei Miele finden sich in der Dampfgarschublade zwei separate Fächer, die man auch zu einem großen Fach mit 14 Liter Fassungsvermögen umfunktionieren kann. Bei Bosch und Siemens gibt es ein großes Fach mit 10 Liter Fassungsvermögen, was laut Siemens etwa 2,5 Kilogramm Kartoffeln aufnehmen kann; Miele nennt hier 3 Kilogramm.
Der Vorteil des Dampfgarens: Durch die fettfreie Zubereitung bleiben Vitamine ebenso erhalten wie die Farbe des Garguts. Mit den 3-in-1-Schubladen kann man außer Dampfgaren auch Auftauen und Backen. Preise für die smarten Dampfgarschubladen haben die Hersteller noch nicht bekanntgegeben.
Schlaue Kochtöpfe
Wer früher Milch erhitzen wollte, ohne dass sie überläuft, griff zum Simmertopf mit doppelwandigem, wassergefülltem Boden. Miele stellt auf der IFA nun die digitale Variante des Simmertopf vor, nämlich Kochtöpfe und Pfannen, die per Bluetooth mit dem Kochfeld kommunizieren und so verhindern, dass der Topf überläuft oder das Essen darin anbrennt. Sobald der Topf meldet, dass etwa das Nudelwasser überzulaufen droht, reduziert der Herd die Temperatur. Das passende Kochfeld erkennt bis zu vier smarte Töpfe oder Pfannen gleichzeitig.
(Bild: Drei Sensorstreifen im Boden und am Topfra.nd erkennen die Hitze des Kochguts und übermitteln diese an das Kochfeld)
Im M-Sense-Topf hat Miele jeweils drei Sensoren integriert, einen am Boden und zwei an der Seitenwand, einen davon kurz über dem Boden und den zweiten nah am Topfrand. Außerdem finden sich zwei Batterien, die austauschbar sind. Sie stecken im Griff, der auch ein Touchfeld enthält, über den man den Topf aktiviert und das gewünschte Gericht einstellt. Anschließend kann man beruhigt – und energieeffizient – mit geschlossenem Deckel kochen.
(Bild: Außer in einen schlauen Kochtopf hat Miele die Sensoren auch in Pfannen integriert; Deren Griffe integrieren die Elektronik und ein Touchfeld,)
Leider kommuniziert der am Miele-Standort in Bünde in Westfalen entwickelte schlaue Kochtopf respektive die M-Sense-Pfanne nur mit einem modernen Miele-Induktionskochfeld der Generation KM8000 aus der oberen Preisklasse. Preise für das Kochgeschirr hat Miele noch nicht bekanntgegeben. Ein Trost: Topf und Pfanne funktionieren im „dummen“ Modus auch als analoge Kochbehälter.
Outdoor-Cooking
Besonders angesagt scheint in diesem Jahr Outdoor-Cooking. Mit seinen robusten Küchen mit Metalltüren liegt Miele deshalb voll im Trend. Die modulare Outdoor-Küche „Dreams“ lässt sich aus 60 aufeinander abgestimmten Modulen zusammenstellen. Neu ist außerdem Küchendesign in mattem Schwarzgrau; das Ganze ist wetterfest und soll Regen ebenso überstehen wie Schneeschauer.
Outddor-Cooking ist angesagt, hier der einige Küchenmodule mit dem intelligenten Gasgrill.
Mit dem intelligenten Gasgrill Fire Pro IQ kann man auch bei Regen oder starkem Wind grillen. Er lässt sich aus der Ferne mit der Miele-App steuern und nimmt darüber auch Rezepte entgegen, die er dann bestimmungsgemäß ausführt. Dabei kann er seine sechs Grillzonen unabhängig steuern und reinigt sie auch gleich nach dem Fest. Der smarte Grill soll rechtzeitig zur Grillsaison 2026 in den Handel kommen, Preise nennt der Hersteller auch hier noch nicht.
(uk)
Künstliche Intelligenz
iX-Workshop: Der schnelle Weg zum zertifizierten Softwarearchitekten (CPSA-F)
Moderne, zukunftssichere Software entwickeln: Im viertägigen iX-Workshop Softwarearchitektur: iSAQB CPSA Foundation Level mit iSAQB-Zertifizierung vom 06. bis 09. Mai 2025 lernen Sie, wie Sie Softwarearchitekturen entwerfen, die diesen Anforderungen gerecht werden.
Diese vom International Software Architecture Qualification Board (iSAQB) lizenzierte Schulung bietet eine umfassende Einführung in die Welt der Softwarearchitektur. Der Workshop beleuchtet alle wichtigen Methoden, Techniken und Werkzeuge, die Sie für den Entwurf und die Implementierung benötigen. In praktischen Übungen wenden Sie das Gelernte direkt an und können am Ende der Schulung eine international anerkannte Zertifizierung ablegen.
iSAQB-Zertifizierung
Der Workshop findet online statt und richtet sich vor allem an Softwarearchitekten und -entwickler. Er dient als offizielle Vorbereitung auf die Prüfung zum „Certified Professional for Software Architecture – Foundation Level“ (CPSA-F), die im Anschluss abgelegt werden kann.
Der Trainer Stefan Conrad ist seit 2001 als Entwickler/Architekt und Trainer tätig und bietet Beratung rund um Architektur und IT-Sicherheit. Er ist Mitglied in der Scrum Alliance so wie der iSAQB, weil er davon überzeugt, dass moderne Architekturen durch agile Ansätze nicht nur innovativer, sondern auch robuster und langlebiger werden.
Oktober 20.10. – 23.10.2025 |
Online-Workshop, 09:00 – 17:00 Uhr 10 % Frühbucher-Rabatt bis zum 21. Sep. 2025 |
(ilk)
-
Datenschutz & Sicherheitvor 3 Monaten
Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken
-
UX/UI & Webdesignvor 3 Wochen
Der ultimative Guide für eine unvergessliche Customer Experience
-
Apps & Mobile Entwicklungvor 3 Monaten
Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen
-
Online Marketing & SEOvor 3 Monaten
TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings
-
Social Mediavor 3 Wochen
Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist
-
UX/UI & Webdesignvor 1 Woche
Adobe Firefly Boards › PAGE online
-
Entwicklung & Codevor 2 Wochen
Posit stellt Positron vor: Neue IDE für Data Science mit Python und R
-
Entwicklung & Codevor 3 Tagen
EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events