Das Start-up ItsNotAI hat ein »Nicht-KI-Siegel« entwickelt, um das Vertrauen in digitale Bilder wiederherzustellen. › PAGE online
Das Zürcher Start-up ItsNotAI entwickelt ein Label, das nicht KI-Inhalte markiert, sondern menschliche Kreativität sichtbar macht. Im Gespräch erklärt einer der Gründer:innen, Thomas Tang, warum Authentizität im Zeitalter generativer Bilder zur knappen Ressource wird und wie ein »Bio-Siegel für digitale Kunst« Vertrauen in visuelle Inhalte zurückbringen soll.
In einer Welt, in der die Grenzen zwischen menschlicher Kreativität und Gestaltung und algorithmischer Generierung zunehmend verschwimmen, wird Authentizität zur neuen Währung. Das Zürcher Start-up ItsNotAI hat sich dieser Herausforderung angenommen. Anstatt lediglich KI-Inhalte zu markieren, setzt das Team auf einen »Trust Layer«, der menschliche Kreativität sichtbar macht. Ob in der Fotografie, im Fotojournalismus oder bei digitalen Kunstwettbewerben wie dem GGAC – ihre hybride Detektionstechnologie, die Vision Transformer mit menschlicher Expertise kombiniert, soll das Vertrauen in digitale Bilder wiederherstellen. Im Gespräch mit PAGE erläutert einer der Gründer:innen, Thomas Tang, warum »menschlich gemacht« in Zukunft ein Luxusgut sein könnte und warum ihr Label das Potenzial hat, zum Bio-Siegel der digitalen Kunstwelt zu werden.
Durch den Fokus auf die verschiedenen Bildschichten kann erkannt werden, ob es sich um KI-generierte Inhalte oder von Menschen erstellte Bilder handelt.
Erinnert ihr euch an den Moment, in dem euch klar wurde: »Wir müssen ItsNotAI gründen«? Was genau ist da passiert?
Unser Team hat ursprünglich einen technischen Hintergrund. Wir haben bemerkt, dass man in sozialen Medien oft nicht mehr echte Aufnahmen von KI-generierten unterscheiden kann und dass dies, da sich die Modelle immer weiter verbessern, in Zukunft mit dem menschlichen Auge gar nicht mehr erkennbar sein wird. Daraufhin haben wir uns mit dem Thema der Erkennung von KI-Bildern befasst, wobei uns die Technologie dahinter sofort begeistert hat. Dieses Problem betrifft aber nicht nur die sozialen Medien, sondern kann in vielen verschiedenen Sektoren massive Schäden anrichten, von Versicherungsbetrug bis hin zu Deepfakes. Durch Gespräche mit lokalen Künstlern haben wir dann von der speziellen Herausforderung gehört, die KI für originelle Fotografie und Illustration darstellt. Deshalb haben wir uns entschieden, einen Service im Format eines Labels für Künstler anzubieten, das authentische, KI-freie Werke klar kennzeichnen soll.
Warum habt ihr euch bewusst dafür entschieden, nicht KI-Inhalte zu markieren, sondern menschliche Arbeit sichtbar zu machen?
Die Kennzeichnung KI-generierter Inhalte funktioniert derzeit unzuverlässig, da sie stark auf Selbstverantwortung basiert. Einige KI-Generatoren nutzen zwar Wasserzeichen, um den Ursprung aus künstlicher Intelligenz zu markieren, aber inzwischen gibt es auch Tools, die genau diese Wasserzeichen aus KI-generierten Bildern wieder entfernen. Wenn bald schätzungsweise mehr als die Hälfte der neuen Inhalte im Internet KI-generiert sind, scheint es für uns sinnvoller, jene Inhalte zu markieren, die nicht KI-generiert sind, da dies in Zukunft wahrscheinlich eher die Ausnahme, als die Regel sein wird. Auch aus ökonomischer Sicht kann es Sinn ergeben, die wertvollere Minderheit hervorzuheben. Auf Bildplattformen, wo mittlerweile immer mehr KI-Inhalte erscheinen, kann ein solches Label Künstlern helfen, sich abzuheben. Gleichzeitig werden unsere Detektionsmodelle auch von Plattformen genutzt, um KI-Content zu erkennen.
Nehmt uns einmal mit durch einen echten Fall: Jemand reicht ein Bild ein, was passiert dann Schritt für Schritt bei euch im Hintergrund?
Das Bild wird völlig unabhängig von seinen Metadaten durch unsere Modelle untersucht. Wir nutzen Ensemble-Modelle, die Convolutional Neural Networks (CNN) und Vision Transformer kombinieren: Das CNN sucht nach Anomalien wie unnatürlichem Bildrauschen, Texturen oder Fehlern im Frequenzbereich, die typisch für KI-Generatoren sind. Der Vision Transformer zerlegt das Bild hingegen in Kacheln (Patches) und analysiert mittels Attention-Mechanismen die globalen Zusammenhänge, ob weit voneinander entfernte Bildelemente, wie Schattenwurf oder Proportionen logisch zusammenpassen. Es gibt mittlerweile mehrere private sowie Open Source Modelle für KI-Erkennung. Der Aufwand besteht darin, diese Modelle laufend zu trainieren und ihre Genauigkeit zu evaluieren.
Mithilfe dieser Schritte kann das System erkennen, ob es sich um KI-generierte Inhalte oder von Menschen erschaffene Bilder handelt.
Gab es schon einen Fall, bei dem eure Systeme uneindeutig waren und ihr wirklich diskutieren musstet, ob ein Bild »menschlich« ist oder nicht? Wie entscheidet man sowas?
Unser Modell liefert eine Wahrscheinlichkeit zwischen 0 und 1. Durch unser Fine-Tuning ist es sehr unwahrscheinlich, dass ein nicht-KI generiertes Bild fälschlicherweise als KI eingestuft wird. In uneindeutigen Fällen behalten wir eine Human-in-the-Loop Komponente: hierbei überprüft ein Experte das Bild manuell auf verbliebene Auffälligkeiten und trifft die finale Entscheidung. Es kann jedoch vorkommen, dass ein KI-Bild nicht sofort erkannt wird, etwa dann, wenn das spezifische KI-Modell, welches das Bild generiert hat, unserem Modell noch nicht bekannt ist. Es kann dann notwendig sein, das Modell teilweise neu zu trainieren.
Ihr habt mit einem Fotografen gearbeitet und große Mengen seiner Bilder analysiert, wie kam es zu dieser Zusammenarbeit?
Der Fotograf verfügte über eine große Sammlung von Bildern, darunter fotojournalistische Arbeiten und historische, politische Aufnahmen. Er wollte sein Werk durch ein Label eindeutig als »nicht-KI« kennzeichnen lassen. Unser ItsNotAI-Label stützt sich auf unsere Detektionsmodelle und dient somit als Bestätigung, dass die Bilder rein menschlichen Ursprungs sind.
Was war das Ziel dieses Projekts? Ging es eher um Schutz, Archivierung oder auch um Sichtbarkeit?
Das Hauptziel war es, unsere Technologie zu testen und ihre erfolgreiche Anwendung zu demonstrieren. Außerdem war es für uns eine sehr gute Gelegenheit, eventuelle Schwachstellen unserer Software ausfindig zu machen und Probleme zu beheben. Wir sind zu der Erkenntnis gekommen, dass es an der UX Einiges zu tun gibt, aber die grundlegende Technologie funktioniert gut.
Was habt ihr durch das Labeln dieser vielen Bilder gelernt? Über Fotografie, aber auch über KI?
Allen voran haben wir gelernt, dass die Zielgruppe eine solche Software und die Transparenz, die wir damit schaffen möchten, sehr wertschätzt. Wir haben beim Labeln auch gemerkt, wie schwer es für den durchschnittlichen Betrachter mittlerweile ist, KI-generierte Bilder als solche zu erkennen. Die KI simuliert Fotografie auf den ersten Blick so makellos, dass sie mit bloßem Auge kaum noch von echten Bildern zu unterscheiden sind. Hier ist eine Analyse durch unsere Software eine deutlich genauere Methode. Aktuell arbeiten wir daran, das Tool in der Verwendung noch intuitiver zu gestalten.
Wie hat der Fotograf selbst auf eure Ergebnisse reagiert? Eher erleichtert, überrascht oder auch kritisch?
Er war vor allem neugierig, diese neue Technologie auszuprobieren und sehr erleichtert, dass sich nun langsam Lösungen etablieren, die mit der rasanten technischen Entwicklung Schritt halten können.
»Unser Detektionsmodell wird eingesetzt, um sicherzustellen, dass in den reinen Human-Art-Kategorien des Wettbewerbs tatsächlich keine KI verwendet wird.«
Lässt sich euer Modell ohne das Label einsetzen?
Ja, absolut. Auf der Visuals Conference in Hamburg haben wir erstmals unser Modell auch als Programmierschnittstelle (API) angeboten. Beispielsweise arbeiten wir zurzeit zusammen mit einem führenden digitalen Kunstwettwettbewerb in Asien, dem GGAC. Unser Detektionsmodell wird eingesetzt, um sicherzustellen, dass in den reinen Human-Art-Kategorien des Wettbewerbs tatsächlich keine KI verwendet wird. Das ist deutlich genauer und effizienter als eine manuelle Überprüfung. Es freut uns sehr zu sehen, dass unsere Technologie weltweit auf Nachfrage stößt.
Was ist die überraschendste Erkenntnis, die ihr seit der Gründung hattet?
Als Team mit technischem Hintergrund war der intensive Austausch mit der Kreativbranche für uns eine besonders wertvolle Erfahrung. Die überraschendste Erkenntnis war dabei die Vielfalt an Zukunftsperspektiven, die große Offenheit gegenüber neuen Tools sowie der ehrliche und offene Austausch innerhalb der Community. Das hat uns sehr geholfen, unsere Software nicht nur aus einer reinen Ingenieursperspektive zu entwickeln, sondern sie exakt an den Bedürfnissen der Branche auszurichten.
Hat sich euer eigener Blick auf Kreativität durch eure Arbeit verändert?
Ja, wir hatten unter anderem auch die Möglichkeit, mit KI-Künstlern über deren Verständnis von Kreativität zu sprechen. Wir schätzen jede Form von Kreativität und verstehen uns in erster Linie als neutrales Tool, das für Transparenz im Kreativitätsspektrum sorgt.
Ihr sprecht von einem »Trust Layer«, wo wird Vertrauen im digitalen Bild heute am dringendsten gebraucht?
Vertrauen – und vor allem ein Tool zur Unterscheidung von KI und nicht-KI – wird überall dort dringend gebraucht, wo man mit bloßem Auge nicht mehr erkennen kann, was echt ist, man aber gezielt authentische Inhalte sucht. Nicht nur auf Kunstplattformen, sondern auch bei Stockbild-Anbietern sieht man, dass KI-Bilder und echte Fotografien zunehmend vermischt werden und immer schwerer zu unterscheiden sind. Dieses Bedürfnis nach Transparenz ist zentral für alle, die echte Bilder suchen, da authentische Werke weiterhin eine besondere Wertschätzung genießen.
Alle Bilder, die von Menschen geschaffen wurden, erhalten ein „Certificate of Human Creation” und einen Tag. “CGI Art” heißt in diesem Fall, dass es am Computer modelliert wurde (z.B. mit Blender).
Seht ihr eure Arbeit eher im Kunstkontext oder auch im Journalismus und bei Desinformation?
Unsere Technologie ist sehr breit anwendbar und in manchen Branchen schlicht essenziell: für Presseagenturen ist es beispielsweise unerlässlich geworden, echte von KI-generierten Bildern unterscheiden zu können. Unsere Technologie ist sehr breit anwendbar. Der Kunstkontext war für uns anfangs wie ein »Trainingslager«, um durch die immense Vielfalt an Bild- und Kreativformen die Grenzen unserer Detektionsgenauigkeit auszutesten. Zudem ist dies eine Zielgruppe, die sehr offen für Innovationen ist. Unser Modell wird heute bereits von Bildanbietern und Plattformen genutzt, um KI-Inhalte in großen Archiven zu identifizieren. Beim Label selbst sehen wir noch eine etwas langsamere Adaption – teils wegen des Integrationsaufwands, teils, weil sich das Vertrauen in ein solches Gütesiegel erst organisch aufbauen muss.
Wie sieht für euch eine Zukunft aus, in der KI und menschliche Kreativität koexistieren?
Wir schätzen jede Form der Kreativität und glauben, dass eine Koexistenz der natürliche Weg sein wird. Wir sehen uns dabei schlicht als das notwendige Werkzeug, um traditionell geschaffene Werke unterscheidbar zu machen.
Was müsste passieren, damit sich euer Label wirklich durchsetzt? Könnte so ein Label irgendwann so selbstverständlich werden wie ein Bio-Siegel?
Wir sind aktuell in Gesprächen, unser Label direkt in Kunstplattformen zu integrieren. Wenn das gelingt, könnte es sehr bald ein weit verbreitetes, kleines Siegel werden, das für viele digitale Werke zum Standard gehört, ähnlich wie das Bio-Siegel im Supermarkt.
Glaubt ihr, dass »menschlich gemacht« in Zukunft tatsächlich zu einer Art Luxus wird?
Ja. KI-Content zu produzieren ist in vielen Fällen günstiger, deutlich schneller und kann bestimmte künstlerische Prozesse komplett ersetzen. Traditionell menschlich hergestellte Kunst wird definitiv seltener und ohne technische Hilfe immer schwieriger als solche zu identifizieren sein. Doch in einer Welt KI-generierter Inhalte ist die echte, menschliche Kreativität unersetzlich. Sie ist der wichtigste Wettbewerbsvorteil von Künstlern, denn es ist genau diese Originalität, die das Publikum tiefgehend wertschätzt und für die es auch in Zukunft bezahlen möchte. Genau hier setzen wir an.