Datenschutz & Sicherheit

KI darf weiter Bücher lesen

Um ein gut funktionierendes KI-Modell zu entwickeln, braucht diese eine große Menge an hochwertigen Daten im Training. Dass große KI-Unternehmen dabei auch urheberrechtlich geschützte Inhalte nutzen, ist nicht neu. In den letzten Jahren haben deshalb bereits einige Urheber Klage eingereicht, so auch einige Autor:innen in den USA. Ende Juni 2025 fällten US-Gerichte gleich zwei Urteile, die wegweisend für zukünftige Verfahren sein könnten. Und beide richten sich gegen Urheber.

2024 zogen drei Autor:innen, Andrea Bartz, Charles Graeber und Kirk Wallace Johnson, gegen Anthropic vor das Bundesgericht im Norden von Kalifornien. Die Firma, 2021 von ehemaligen Open AI-Mitarbeitenden gegründet, baute eine zentrale, dauerhaft bestehende Bibliothek mit allen Büchern der Welt auf. Große Teile davon lud Anthropic im Internet herunter: aus piratisierten Schattenbibliotheken wie LibGen. Ihre eigens aufgebaute Bibliothek nutzte Anthropic auch als Datenquelle zum Training ihrer Large Language Models (LLMs) wie Claude.

Vor Gericht klagten Batz, Graeber und Johnson, dass ihr Schaden nicht nur in der unerlaubten Nutzung ihrer Werke aus den Schattenbibliotheken bestünde. Es gehe auch darum, dass die KI von Anthropic nach dem Training in der Lage sei ähnliche Werke wie ihre Eigenen zu generieren. Dies würde ihren Werken Konkurrenz schaffen und ihren Profit beeinträchtigen.

Gerichtsprozess gegen Meta

Mit ähnlichen Vorwürfen zog bereits 2023 ein Zusammenschluss von Autor:innen gegen Meta vor Gericht in San Francisco. Der Konzern hat zwar nicht die Ansprüche, eine eigene Bibliothek aufzubauen, aber hat ebenfalls Bücher aus Schattenbibliotheken heruntergeladen und für das Training seiner LLMs, spezifisch Llama, verwendet.

Anthropic und Meta berufen sich zu ihrer Verteidigung in beiden Gerichtsverfahren auf Ausnahmen im US-Urheberrecht. Denn unter gewissen Umständen erlaubt dieses eine nicht-autorisierte Nutzung von geschütztem Material auf Grundlage der sogenannten Fair Use-Doktrin.

Fair Use-Doktrin schützt nicht-genehmigte Nutzung

Seit 1976 erlaubt die Fair Use-Doktrin (17 U.S.C. §107) das Nutzen von urheberrechtlich geschütztem Material zur Kritik, Stellungnahme, Berichterstattung, Bildung und Forschung. Im Einzelfall entscheiden Gerichte anhand vier Faktoren: Zweck der Nutzung und wie stark das Ursprungswerk verändert wurde, die Art des Ursprungswerkes und wie viel Kreativität in der Erstellung nötig war, der verwendete Anteil des Ursprungswerkes und die Auswirkungen auf den Verkaufsmarkt des Ursprungswerkes. Weil diese Faktoren in der Doktrin nicht breit erläutert werden, orientiert sich eine Auslegung stark an bereits gefällten, aussagekräftigen Urteilen, sogenannten Präzedenzfällen.

Im Bereich des KI-Trainings sind jedoch noch nicht so viele Urteile gefallen, welche für die Auslegung der Fair Use-Doktrin zu Rate gezogen werden können. Entsprechend können die kürzlich verkündeten Urteile in Zukunft eine solche Rolle in der Rechtsprechung einnehmen.

Wie bewerteten die Richter Fair Use

Im Fall gegen Anthropic urteilte Richter William Alsup nun am 23. Juni 2025, dass Anthropics Nutzung der Werke ein Fall von Fair Use war. Besonders eingeflossen ist in die Entscheidung, dass die Autor:innen keine konkreten Beispiele benennen konnten, dass und wo Claude ihre Texte reproduziert habe. Dies soll auch technisch sichergestellt sein durch eine einprogrammierte Sperre in den Modellen.

Obwohl die Nutzung der Bücher für den Trainingsprozess urheberrechtlich erlaubt war, entschied das Gericht, dass die Aufbewahrung der Bücher aus Schattenbibliotheken für zukünftige, undefinierte Zwecke in einer großen Bibliothek nicht rechtens war. In Zukunft könnte besonders die Einschätzung zu der Transformation zwischen den originalen Werken und dem „Werk“ von Anthropic wichtig werden. Wenn vor Gericht geprüft wird, ob es sich um einen Fall von Fair Use handelt, kann besonders diese Veränderung ausschlaggebend sein.

LLMs seien höchst transformativ, so die Einschätzung von Alsup. Zudem urteilte der Richter, dass Urheberrecht vor Replikation schütze, nicht aber vor Konkurrenz auf dem Markt. Somit hätte Anthropics Sprachmodell Claude nicht mehr Einfluss auf den Markt als andere Autor:innen.

Richter setzt Zeichen für stärkeren Schutz von Urhebern

Ganz gegenteilig sieht es Vince Chhabria, Richter im Prozess gegen Meta. Dieser widerspricht Alsups Einschätzung zur Auswirkung auf den Markt und erkennt das Potenzial von KI an, den Markt mit generierten Büchern zu überschwemmen. Dieser finanzielle Schaden sei noch größer bei kürzeren schriftlichen Werken, beispielsweise Nachrichtenartikeln.

Leider, so Richter Chhabria, hätten die Autor:innen ihre Argumente nicht stark genug belegt und konnten den Einfluss auf den Buchmarkt nicht gut genug zeigen. Deswegen fiel auch hier das Urteil am 25. Juni 2025 für Meta aus: Die Verwendung von urheberrechtlich geschützten Büchern sei erlaubt unter US-Urheberrecht.

US Urheberrechtsbehörde liefert ähnliche Einschätzung

Diskussionen rund um KI erreichen nun also auch die Legislative in den USA und erste Urteile legen die Grundsteine für kommende gängige Rechtsprechung. Eine klare Tendenz für oder gegen Autor:innen kristallisiert sich aus gefallenen Urteilen noch nicht heraus. Momentan laufen über 30 Verfahren in den Staaten, welche sich mit Urheberrechtsverletzungen durch KI-Unternehmen beschäftigen.

Im Rahmen der sich häufenden Klagen veröffentlichte das United States Copyright Office (USCO) im Mai 2025 eine vorläufige Einschätzung zur Gesetzesauslegung von Urheberrecht bei KI-Trainingsprozessen. In dieser nicht-bindenden Einschätzung wird betont, dass besonders die Faktoren der Transformation des Ursprungswerkes und der Markteinfluss ausschlaggebend für oder gegen eine Fair Use-Entscheidung seien. Es müsse aber von Fall zu Fall entschieden werden.

Eine klare Aussage trifft das USCO jedoch über das Nutzen von Schattenbibliotheken: Kreative Werke aus piratisierten Internetquellen zu nutzen, sei kein Fall von Fair Use – wenn auch die Möglichkeit besteht, eine Lizenz für diese Werke zu erwerben.

Deutschland benennt KI-Training im Urheberrecht

Ein breit auslegbares Konzept wie Fair Use gibt es im deutschen Urheberrecht nicht. Stattdessen sind konkretere Schrankenregelungen fest definiert für bestimmte Zwecke, die das Recht der Urheber beschränken.

Durch eine Umsetzung einer EU-Richtlinie wird maschinelles Lernen im deutschen Urheberrecht genauer als in den Vereinigten Staaten behandelt. Der §44b im Urheberrechtsgesetz (UrhG) beschränkt die Rechte der Urheber und erlaubt im Gegenzug, die Werke für eine automatisierte Analyse zu vervielfältigen, zum Beispiel bei KI-Trainingsprozessen.

Dabei müssen Vervielfältigungen nach Abschluss des KI-Trainings gelöscht werden. Nutzung von urheberrechtlich geschützten Werken für den KI-Trainingsprozess ist damit auch für den kommerziellen Gebrauch und nicht nur für die Forschung erlaubt.

Autor:innen können widersprechen

Autor:innen und andere Urheber können der Nutzung ihrer Werke im Voraus widersprechen („opt out“). Dazu sei es möglich, vor Gericht zu argumentieren, dass Schrankenregelungen wie §44b UrhG einigen Kriterien entsprechen müssen, sagt der Urheberrechtsanwalt Dr. Andreas Dustmann. Die Nutzung dürfe etwa die normale Verwertung des Werkes nicht beeinträchtigt und die berechtigten Interessen des Urhebers nicht verletzen.

Wenn eine KI also nach dem Training in der Lage sei, beispielsweise Fortsetzungen zu Büchern zu schreiben, dann entstünde eine Bedrohung für die Verwertungs- und Existenzgrundlagen der Urheber, die vor Gerichts bewertet werden muss.

Genauere Auslegungen dieser Einsprüche werden sich in kommenden Urteilen zeigen. Bis jetzt gibt es noch kein aussagekräftiges Urteil, welches eine Einschätzung der zukünftigen Auslegung der Rechtslage möglich macht.

Source link

Verwandte Themen:Bücher darf lesen weiter

Inspohub