Online Marketing & SEO

Meta-Leak: Millionen Domains für KI-Training genutzt?


Rechtliche Grauzone mit großem Risiko

Das Training von KI mit fremden Inhalten sorgt seit Jahren für juristische Auseinandersetzungen. In den USA klagten bereits mehrere Autor:innen und Verlage gegen große KI-Player. Eine Sammelklage prominenter Schriftsteller:innen wie Sarah Silverman und Ta-Nehisi Coates gegen Meta wurde im Juni 2025 zwar abgewiesen – jedoch nur, weil das Gericht die vorgelegten Beweise als unzureichend einstufte. Richter Vince Chhabria stellte klar, dass das „dramatische Untergraben“ der Märkte für urheber:innenrechtlich geschützte Werke durch KI-Training ein reales Risiko sei.

Eine Untersuchung des Stanford Internet Observatory aus dem Dezember 2023, über die The Guardian berichtete, ergab, dass der offene LAION-5B-Datensatz, der unter anderem für das Training von Stable Diffusion genutzt wurde, über 3 200 Bilder mit mutmaßlicher sexueller Gewalt gegen Minderjährige enthielt – davon wurden etwa 1 000 extern validiert. Der Studienautor David Thiel, Chief Technologist am Stanford Internet Observatory, warnte gegenüber der Associated Press, dass fehlende Transparenz bei Trainingsdaten „eine ganze Reihe von Rechts- und Sicherheitsproblemen“ aufwerfen könne.

Teil eines milliardenschweren KI-Wettrüstens

Meta steckt aktuell bis zu 72 Milliarden US-Dollar pro Jahr in den Ausbau der eigenen Infrastruktur und in KI-Projekte. Laut Reuters fließt der Großteil in den Aufbau leistungsstarker Rechenzentren, die die KI-Entwicklung beschleunigen sollen. Zugleich hat der Konzern hochkarätige KI-Forschende von Wettbewerber:innen wie OpenAI abgeworben. Reuters berichtete im Juni 2025, dass drei führende Expert:innen zu Metas „Superintelligence“-Einheit wechselten – teils mit außergewöhnlich hohen Bonuszahlungen.

Die geleakten Daten treffen Meta in einer sensiblen Phase: Mit LLaMA 4 und weiteren Modellen will der Konzern die eigene Position im KI-Markt ausbauen. Gleichzeitig verweigerte Meta im Juli 2025 die Unterzeichnung des EU-Verhaltenskodex für verantwortungsvolle KI mit der Begründung, die Vorgaben erzeugten „rechtliche Unsicherheit“ für Entwickler:innen.

Konsequenzen für Publisher und Creator

Für Publisher und Creator steht viel auf dem Spiel. Die nicht autorisierte Nutzung ihrer Inhalte kann Reichweite und Erlöse gefährden und das Vertrauen in Plattformen weiter schwächen. Ken Mickles von der Digitalrechtsorganisation Fight for the Future warnt, dass Unternehmen wie Meta „faktisch Macht über das gesamte Internet“ gewinnen könnten, wenn sie ungehindert Inhalte scrapen.

Wie stark die geleakten Inhalte Metas Modelle tatsächlich prägen, bleibt unklar – Meta selbst macht dazu keine Angaben. Fest steht: Die Debatte um Urheber:innenrecht, Datennutzung und KI-Training wird mit diesem Leak weiter an Schärfe gewinnen.


Meta stellt die persönliche Superintelligenz vor
– KI erhöht schon Nutzungszeit auf Instagram





Source link

Beliebt

Die mobile Version verlassen