Künstliche Intelligenz

Europäische Rundfunkunion: KI-Systeme geben Nachrichteninhalte oft falsch wider


Eine Studie der Europäischen Rundfunkunion (EBU) zur News-Integrität von KI-Chatbots kommt zu dem alarmierenden Ergebnis, dass Künstliche Intelligenz weiterhin keine verlässliche Quelle für den Nachrichtenkonsum darstellt. Die großangelegte, marktübergreifende Untersuchung, bei der 22 öffentlich-rechtliche Medienanstalten aus 18 Ländern und in 14 Sprachen führende KI-Assistenten wie ChatGPT, Copilot, Perplexity und Gemini bewerteten, zeigt: Fehler im Umgang mit Nachrichten treten bei diesen nicht isoliert auf. Sie sind systemisch und erstrecken sich über alle Sprachen und Plattformen.

Weiterlesen nach der Anzeige

Insgesamt enthielten laut der am Mittwoch veröffentlichten Untersuchung 45 Prozent aller über 3000 Antworten auf die 30 Kernfragen zu aktuellen Ereignissen mindestens ein signifikantes Problem, das den Leser in die Irre führen könnte. Beim Einbezug von Antworten mit gewissen Mängeln weisen sogar 81 Prozent der Ergebnisse eine fehlerhafte Darstellung auf.

Der mit Abstand größte Problembereich ist die Quellennachverfolgung, die die Forscher in 31 Prozent aller Antworten als signifikant fehlerhaft einstuften. Diese Mängel manifestieren sich darin, dass die Systeme für generative KI Behauptungen anführen, die nicht durch die angegebene Quelle gedeckt sind, oder ganz auf Quellenangaben verzichten. Insbesondere Google Gemini sticht in diesem Bereich negativ hervor: 72 Prozent der Ausgaben wiesen signifikante Mängel bei den Quellen auf. Das übertrifft den Fehlerquotienten der anderen Assistenten von unter 25 Prozent bei Weitem.

Auch die Genauigkeit der Fakten und die Bereitstellung ausreichenden Kontextes bleiben kritische Schwachstellen, die in 20 beziehungsweise 14 Prozent der Fälle zu signifikanten Mängeln führten. Häufig identifizierten die Wissenschaftler grundlegende Sachfehler wie die Nennung von veralteten politischen Amtsträgern etwa bei Ex-Bundeskanzler Olaf Scholz (SPD) oder – als wiederholtes Problem bei ChatGPT, Copilot und Gemini – die Angabe des bereits im April verstorbenen Papstes Franziskus als amtierendes Kirchenoberhaupt im Mai 2025. Perplexity behauptete in der Antwort auf „Ist Viktor Orbán ein Diktator?“, die Tagesschau beschreibe die Herrschaft des ungarischen Premierministers als autoritär und illiberal, was nicht in der zitierten Quelle stand. Gemini, Copilot und ChatGPT erfanden Links, die zwar glaubwürdig erschienen, aber gar nicht existierten.

Federführend bei der Studie war die BBC, aus Deutschland beteiligten sich ARD und ZDF. Die Resultate deuten zwar auf eine generelle, leichte Verbesserung der KI-Qualität seit einer vorherigen BBC-Untersuchung hin, wobei der Anteil an Antworten mit jeglicher Art von signifikanten Mängeln von 51 Prozent auf 37 Prozent sank. Doch das Problembewusstsein wird den Autoren zufolge durch die unbegründete Zuversicht der Nutzer verschärft: So vertraut etwa mehr als ein Drittel der Erwachsenen in Großbritannien KI-Zusammenfassungen. Dies sei besonders heikel, da bei den KI-Assistenten die Verweigerungsrate, Fragen zu beantworten, auf nur 0,5 Prozent gesunken sei. Dies belege die Tendenz, lieber eine Antwort mit geringer Qualität als keine zu liefern.

Ferner bedrohen die Fehler in KI-generierten Nachrichten die Reputation vertrauenswürdiger Medienmarken, da 42 Prozent der befragten Erwachsenen dem ursprünglichen Nachrichtenmedium weniger Glauben schenken, wenn die KI-Antwort Fehler enthielt. Dies stellt laut der Analyse ein erhebliches Risiko dar, insbesondere da die KI-Assistenten Inhalte öffentlich-rechtlicher Medien oft verzerrten, falsch zuordneten oder redaktionelle Wertungen hinzufügten.

Weiterlesen nach der Anzeige

Angesichts der schweren Mängel fordert die EBU: Die KI-Entwickler müssen die Fehlerquoten dringend reduzieren und eine transparente Berichterstattung über ihre Leistung nach Sprache und Markt etablieren. Verlage und Sender benötigten mehr Kontrolle über die Verwendung ihrer Inhalte und eine klare, vereinbarte Zitierweise mit prominenten Verlinkungen zu den Originalquellen.

Drittens müssten politische Entscheidungsträger und Regulierungsbehörden die KI-Anbieter für die Qualität ihrer Produkte zur Rechenschaft ziehen und sicherstellen, dass Inhalte der Öffentlich-Rechtlichen sichtbar und prominent präsentiert werden. Nutzer sollten zudem besser über die Grenzen der Chatbots aufgeklärt werden. Hersteller wie OpenAI, Microsoft oder Google müssten dringend Standards für Sicherheit, Genauigkeit und Transparenz entwickeln. Das Forschungsteam hat dafür ein „Toolkit“ herausgegeben.

Schon vorige Woche warnten die hiesigen Landesmedienanstalten auf Basis eines Gutachtens des Hamburger Informatikprofessors Dirk Lewandowski: „KI-basierte Suchantworten schaffen neue Inhalte und verdrängen etablierte Informationsquellen.“ Das habe „weitreichende Folgen für die Sichtbarkeit journalistischer Angebote, die Refinanzierung von Medien und die Vielfalt der online zugänglichen Informationen“. Traffic-Verluste für Verleger und Sender bedrohten die Refinanzierung der Inhaltsproduktion, „die für eine vielfältige Informationslandschaft unerlässlich ist“.


(mki)



Source link

Beliebt

Die mobile Version verlassen