Künstliche Intelligenz

KI-Papers bei arXiv: Sperre bei erstem Verstoß


Erst im November hatte die offene Plattform arXiv neue Regeln für Inhalte aus LLMs vorgelegt, nun gibt es noch härtere Sanktionen. Für eine Vielzahl von unwissenschaftlichen Methoden bei den dort veröffentlichten Papers kann eine sofortige Sperre von einem Jahr verhängt werden. Und wenn eine so aufgefallene Person danach Arbeiten einreicht, werden diese erst publiziert, wenn sie bei einem anderen renommierten wissenschaftlichen Medium schon erschienen, oder für einen Vortrag bei einer entsprechenden Konferenz angenommen wurden.

Weiterlesen nach der Anzeige

ArXiv dreht in diesen Fällen sein bisheriges Vorgehen um. Seit über drei Jahrzehnten ist die Plattform unter Wissenschaftlern vor allem deswegen beliebt, weil eine Veröffentlichung wie ein Paper oder eine Studie nicht erst „peer reviewed“ sein muss. Dem aufwändigen Prozess, bei dem in der Regel über Monate Personen aus dem selben Fachgebiet die Inhalte prüfen, konnte man so – zumindest vorübergehend – entgehen. Bei den Veröffentlichungen handelt es sich dann um „Preprints“, was historisch für noch nicht gedrucktes Material steht. Fast drei Millionen solcher Preprints hat arXiv seit 1991 veröffentlicht.

Offenbar wird diese Möglichkeit im Zeitalter von Künstlicher Intelligenz zunehmend missbraucht, und zwar über alle Fachbereiche hinweg. Ende 2025 galt zunächst, dass für Computerwissenschaften beziehungsweise Informatik immer ein peer review gefordert ist und das Paper bei einer Konferenz oder einem Journal akzeptiert worden sein muss. Nun gilt das, bei einem KI-Verstoß, auch für alle anderen Bereiche. Dabei gibt es keine Verwarnung, aber auch menschliche Prüfung. Wie Thomas Dietterich, Leiter der Abteilung für Computerwissenschaften bei arXiv, 404 Media sagte, muss ein Verstoß von einem der Moderatoren von arXiv dokumentiert und intern bestätigt werden, bevor eine Sperre erfolgt. Es gibt auch die Möglichkeit des Einspruchs, also gegebenenfalls zumindest eine zweite Prüfung.

Die Sperren sollen auch nur, wie Dietterich bei X schrieb, bei „unwiderlegbaren Beweisen“ für falsche Nutzung von KI im Kontext von Wissenschaft verhängt werden. Dabei, so schreibt er auf der Plattform in einem Thread, ist der Autor eines Papers stets für dessen gesamten Inhalt verantwortlich. Wenn man aber etwa Falschbehauptungen aus einem LLM finde, „bedeutet das, dass wir dem ganzen Paper nicht vertrauen können“, so Dietterich.

Zu den Verstößen, die geahndet werden können, zählen laut Dietterichs Beiträgen bei X „unangemessene Sprache, plagiiertes Material, voreingenommene Inhalte, Fehler, Irrtümer, fehlerhafte Referenzen oder irreführende Inhalte“. Vor allem der vorletzte Punkt der Aufzählung ist in vermeintlich wissenschaftlichen Arbeiten schon häufiger aufgefallen. LLMs „halluzinieren“ frei erfundene Quellen herbei, um ihre Behauptungen aufrechterhalten zu können.

Weiterlesen nach der Anzeige

Die Änderungen bei arXiv dienen offenbar nicht nur dem Bemühen um ordentliches wissenschaftliches Arbeiten. Bisher wird das Projekt vorwiegend von Cornell Tech, einer Sparte der Cornell University in New York City betrieben. Ab 1. Juli 2026 soll arXiv aber als gemeinnütziges Unternehmen ausgegliedert werden. Solche Organisationen sind in den USA vorwiegend auf Spenden angewiesen, wofür der gute Ruf besonders wichtig ist. Cornell wurde, wie zahlreiche andere Universitäten, im April 2025 durch die Trump-Regierung durch Zurückhalten von Forschungsgeldern von vier Milliarden US-Dollar sanktioniert. Seitdem wehren sich die Universitäten zwar vor Gericht, Projekte wie arXiv suchen parallel nach neuen Finanzierungen.


(nie)



Source link

Beliebt

Die mobile Version verlassen