Künstliche Intelligenz
Fakes im Netz: So entlarvt jeder KI-generierte Videos (von uns getestet)
KI-generierte Videos werden immer realistischer. c’t 3003 hat den Test gemacht und das eigene Team mit 15 Clips konfrontiert – einer Mischung aus echten Aufnahmen und Generierungen aus aktuellen KI-Tools. Das Ergebnis zeigt: Selbst geübte Augen liegen manchmal daneben.
Weiterlesen nach der Anzeige
Transkript des Videos
(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder. Zudem gibt es hier nur einen Ausschnitt aus dem Video zu lesen. Den Rate-Teil gibt es ausschließlich im Video selbst.)
Guckt mal hier, dieses Video ist KI-generiert. Klar, hättet ihr auch erkannt, wenn ich das nicht gesagt hätte, aber bei dem hier ist es dann schon deutlich schwieriger, oder? KI-Videos sind in den letzten Monaten auf jeden Fall deutlich besser geworden. Genauso wie KI-Stimmen, weil das gerade war gar nicht meine echte Stimme, sondern mein KI-Stimmklon. Ja, alles ganz schön verwirrend und natürlich potenziell gefährlich. Die KI-Fakes sind ja auf Social Media jetzt schon allgegenwärtig. Uns hat interessiert: Kann man KI-Videos noch einigermaßen einfach als Fakes erkennen, oder ist das schon vorbei? Und ich dachte, wenn das vielleicht noch einer auseinanderhalten kann, dann ja hoffentlich meine Kollegen hier bei c’t 3003. Und deswegen habe ich ein Quiz erstellt: Einige KI-Videos gemischt mit echten Kameraaufnahmen und Sahin, Chris und Keno schauen die jetzt gemeinsam mit euch und versuchen, die KI zu erkennen. Ihr könnt mitraten und am Ende gebe ich euch noch ein paar handfeste Tipps und Tricks, mit denen ihr in Zukunft KI-generierte Inhalte zuverlässig erkennen könnt. Also, bleibt dran!
Liebe Hackerinnen, liebe Internet-Surfer, herzlich willkommen hier bei …
Den Rate-Teil gibt es nur im Video zu sehen.
Bevor wir gleich auflösen, wer am besten geraten hat, zeige ich euch jetzt konkret, woran man KI-Videos im Jahr 2026 noch erkennt. Denn ja, das geht noch. Und auch wenn die Modelle besser werden, ein paar Tipps helfen euch sicher auch dann noch.
Fangen wir mit dem dicksten Brocken an: Physik. So eine KI wie Kling oder Google Veo kennt keine Schwerkraft, kein Gewicht, die berechnet nur, welches Pixel als nächstes am wahrscheinlichsten kommt. Bestes Beispiel war unser Angler, der ins Wasser fällt. Der fällt nicht, der wird gefallen, wie an unsichtbaren Drähten. Das echte Körpergewicht fehlt. Dafür ist das Wasser in dem Clip schon sehr gut. Das ist mir generell aufgefallen, dass die neue Generation von KI-Videogeneratoren echt gut mit Wasser klarkommt, auch hier dieser Wasserfall, das hätte früher viel schlechter ausgesehen.
Weiterlesen nach der Anzeige
Anders ist das bei Feuer. Beim brennenden E-Scooter fällt auf: KI-Feuer brennt nicht, es fließt, eher wie so leuchtendes Plasma. Und echtes Feuer wirft harte, flackernde Schatten auf die Umgebung. Bei der KI fehlt der fast immer, weil sie anders als aktuelle Spiele nicht das Verhalten von Licht simuliert, Stichwort Ray-Tracing. Witzigerweise hat uns dieselbe Physik bei einem echten Clip aufs Glatteis geführt. Das Video, wo Sepp Blatter mit Geldscheinen beworfen wird, das sah so absurd aus, dass man vielleicht erst KI dachte. Aber wie da jeder Schein einzeln rotiert und das Licht einfängt, das kriegt eine KI aktuell so nicht hin. Manchmal ist also perfekte Physik der Beweis, dass es echt ist.
Genauso wie Objekt-Interaktion oft ein guter Indikator ist, also das Clipping-Problem. Sobald sich zwei feste Materialien berühren, verliert die KI oft die Grenze dazwischen. Wir hatten den echten Söder, der in eine Bratwurst beißt, und dann den KI-Söder, der aus der Bierflasche trinkt. Und achtet mal hier auf das Zusammenspiel zwischen Flasche und Lippen. Und im Vergleich dazu meine Lippen und die Flasche in nem echten Video. Das ist mittlerweile kein großer Unterschied mehr. Noch deutlicher ist das aber hier beim Fahrradfahrer, der gegen das Fenster hämmert. Eigentlich müsste sich die Haut plattdrücken. Tut sie nicht. Die Finger bleiben rund und rutschen ohne Widerstand ab.
Denn Anatomie und Bewegung sind oft noch schwer. Klar, auch in KI-Videos haben Menschen mittlerweile zuverlässig fünf Finger an der Hand und einzelne Gesichter können die Modelle inzwischen fast perfekt. Aber es bricht zusammen, sobald Bewegung oder Tiefe ins Spiel kommt. Schaut in Menschenmengen in den Hintergrund. Bei unserem Fanmeilen-Video sehen die Leute vorne okay aus, aber hinten verschmelzen sie zu einem regelrechten Fleischberg. Arme aus dem falschen Körper, Gesichter nur noch hautfarbene Flecken und besonders bei schneller Bewegung passieren aktuell noch Fehler. Der rennende Golden Retriever aus diesem Clip hier, das ist klassisches Ghosting, also Pfoten, die leicht über dem Asphalt schweben und unnatürlich wirkende Bewegungen, weil die KI den Motion Blur falsch interpoliert. Genereller Tipp: Achtet auf die Füße beim Gehen. Oft rutschen die Sohlen über den Boden, als würde die Person schliddern.
Und achtet auf Schrift in den Videos. Unser Gehirn ist mega gut darin, Buchstaben zu erkennen, und genau da scheitert die KI, sobald sich was bewegt. Bestes Beispiel war unser Dashcam-Video. Solange das Nummernschild still steht, geht es noch, aber sobald Bewegung dazu kommt, morphen die Zeichen in unleserliche Alien-Hieroglyphen. Temporal Flickering nennt man das. Dasselbe passiert mit Maschendrahtzäunen oder Karomustern. Und achtet auf unlogische Asymmetrie: Brillenbügel, die im Nichts enden, oder eine Jacke, die links Knöpfe hat und rechts einen Reißverschluss.
Fünfter Punkt: die Optik. Und der hat uns echt ausgetrickst. Schaut, ob feine Texturen im Hintergrund anfangen zu wabern. Das nennt man Boiling, weil es aussieht, als würde das Bild leicht kochen. Wir hatten den Drohnenflug über die Klippen von Madeira, und ich war Anfang Juni erst da, in echt flimmert das Grünzeug an der Steilwand nicht so komisch. Die KI musste jedes Blatt aber einzeln in jedem Frame neu erfinden, weil sie keine feste 3D-Karte der Umgebung im Kopf hat. Zum Vergleich der echte Drohnenflug über die Reihenhaussiedlung in Kanada: Da bleiben Dächer, Linien und Zäune absolut starr.
Und jetzt der wichtigste Teil, der euch auch dann noch rettet, wenn die Pixel irgendwann mal perfekt sind. Gesunder Menschenverstand. Der wichtigste Test bei so viralen Clips: Warum wird hier eigentlich gefilmt? Warum sollte jemand mit ruhiger Hand eine leere Landstraße filmen, auf der drei Sekunden später ein Meteorit einschlägt? Wenn die Kamera schon vorher zu perfekt draufhält, fehlt die menschliche Reaktionszeit. Und dann natürlich auf Logik achten. Also beim E-Scooter explodiert ein Feuerball und die Fußgänger spazieren seelenruhig weiter. Ja, die KI versteht Kausalität nicht. Wenn ihr in dem Video was wirklich krasses seht, dann macht einfach den Doppelcheck. Also sucht nach anderen Perspektiven, andere Aufnahmen davon. Macht einen Screenshot und schmeißt den in die Google-Bildersuche. Weil, wenn das wirklich so passiert ist, dann gibt es davon immer mehr als dieses eine Video, das ihr gerade gesehen habt. Und achtet auch auf das Audio. Viele KI-Videos werden ohne Ton erzeugt oder haben eben noch recht offensichtlichen KI-Ton.
So, das ist eure Checkliste: Physik, Clipping, Anatomie, Schrift und gesunder Menschenverstand. Und jetzt, wo ihr das alles wisst, hättet ihr unsere 15 Clips bestimmt alle richtig erraten, oder? Tja, unsere drei Ratenden, denn hier hatten ja nicht bei jedem Video recht. Chris hatte zwei Fehler und Sahin und Keno hatten drei Fehler. Das war Chris DeBolle. Alright! Nehme ich nicht an. Danke, danke. Ich nehme es an. Herzlichen Glückwunsch. Danke. Bin nur froh, dass Keno nicht gewonnen hat. Ja, ich auch. Was? Ja, creepy.
Also ein Jahr noch. Ja. Dann haben wir ein Problem. Ich glaube, wir haben jetzt schon ein Problem, weil die normalen Leute deutlich weniger diese relativ offensichtlichen Hinweise erkennen. Also mir ist es aber auch schon auf Social Media passiert, dass ich ein KI-generiertes Video für echt gehalten habe. Auf jeden Fall. Mir passiert das, also deswegen hat es mich gewundert, dass wir es hier nicht hatten, Überwachungskamera-Footage. Oder so hier diese… Dashcam. Ja, Dashcam. Das war ja so High-Class-Dashcam, die wir da hatten. Aber genau, Türspion und diese Fitton-Hole-Kamera. Ring, diese Ring-Kamera. Genau, da bin ich schon öfter mal drauf reingefallen. Und dann fängt dann plötzlich an so… Also erst denke ich, ist echt, und dann fängt plötzlich an eine Katze irgendwie, weiß ich nicht, Mariachi-Band-mäßig auszuspielen. Ich schicke auch gerne meiner Freundin solche Tiervideos, wo sie dann sagt so: „Ey, so merkst du.“ Habt ihr diese drei Hasen gesehen auf dem Trampolin? Nee. Aber das war ein Genre. Da gab es doch zuerst ein Känguru oder so und dann… Aber das war so das erste, wo die Breitenmassen wirklich alle kurz drauf reingefallen sind. Da hatte ich so den Eindruck. Also bei den KI-generierten Bildern war es dieses Papst-Bild mit dieser… Ja, das war kein Kippt. Und bei Videos war es dieses Tier auf dem Trampolin. Ich fand auch, Sam Altman wird beim Klauen erwischt. Das hat mich richtig abgeholt, weil das wollte ich auch. Das ist nämlich das Problem auch bei diesem politischen Content, der gedeepfaked ist. Wenn das das ist, was die Leute eh glauben wollen, dann ist natürlich die Tendenz noch höher. Ja, aber was können wir denn jetzt, wir reden da im Podcast nochmal genauer drüber. Könnt ihr euch drauf freuen.
Das war’s von unserem KI-Quiz. Im kommenden 4004-Podcast reden Chris und Keno nochmal ausführlicher über dieses KI-Experiment, das wir hier gerade gemacht haben. Hört da unbedingt mal rein. Und ansonsten schreibt uns gerne mal in die Kommentare, wie gut ihr bei diesem Quiz abgeschnitten hättet. Hättet ihr alles erkannt oder wo seid ihr der KI auf den Leim gegangen? Und natürlich gerne abonnieren und bei unserem Newsletter reinschauen. Bis zum nächsten Mal. Tschüss!
c’t 3003 ist der YouTube-Channel von c’t. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen, Lukas Rumpler, Sahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.
(rum)