Connect with us

Künstliche Intelligenz

Wie OpenAI erklärt, warum LLMs bei völliger Ahnungslosigkeit sicher auftreten


Der Begriff Halluzination ist für den Fachbereich KI vergleichsweise jung, verbreitete sich aber seit seinem Auftauchen vor wenigen Jahren rasch. Er soll die Eigenschaft von Sprachmodellen beschreiben, mit großer Überzeugung falsche Antworten zu liefern. Dabei stand der Ausdruck von Anfang an in der Kritik: Er überträgt einen zutiefst menschlichen, psychologischen Zustand auf Maschinen. Damit hat er die Debatte mehr verschleiert als erhellt.




Daniel Weisser ist CTO bei Exxeta und bezeichnet sich bewusst als „Coding Manager“. Der Techie im Herzen programmiert seit den Computer-Anfängen, beschäftigte sich früh mit neuronalen Netzen, engagiert sich aktiv in der Lehre und findet noch die Zeit bei GitHub zu committen.

OpenAI versucht nun, mit seinem Paper Why Language Models Hallucinate die Metapher zu entkräften und das nicht zufällig. Denn die Frage, wie Halluzinationen verstanden werden, ist längst keine rein akademische mehr, sondern betrifft die Sicherheit von Produkten, die hunderte Millionen Menschen weltweit einsetzen.

Das Paper setzt zwei Schwerpunkte: Zum einen betont es die statistische Unvermeidbarkeit bestimmter Fehler bereits im Pre‑Training. Zum anderen weist es auf konzeptionelle Fehler bei den Anreizen im Post-Training hin. Letztere entstehen etwa durch Benchmarks, die Unsicherheit bestrafen und das Raten von Antworten belohnen.

Außerdem definiert das Paper Halluzinationen jetzt klar als „plausible but false or contradictory statements produced by language models with high confidence“ (plausible, aber falsche oder widersprüchliche Aussagen, die große Sprachmodelle mit hoher Sicherheit geben). Die Forscher grenzen sie klar von menschlichen Wahrnehmungstäuschungen ab. Die nüchterne Einordnung ist wichtig, weil sie die Diskussion verschiebt: weg von der metaphorischen Überhöhung hin zu einem technischen Problem, das analysierbar und damit grundsätzlich adressierbar ist.

Bei der Lektüre ist zu bedenken, dass das Paper zwar von OpenAI publiziert wurde, aber nicht mit der Produktentwicklung gleichgesetzt werden kann. Natürlich ist hier eine, wenn auch indirekte, Rückkopplung zu vermuten. Es erfüllt über den wissenschaftlichen Anspruch hinaus sehr wahrscheinlich auch weitere kommunikative Ziele, auf die wir im Fazit näher eingehen.

Der Beitrag von OpenAI vergegenwärtigt den Lesern, dass Sprachmodelle keine absoluten Wahrheiten lernen, sondern Wahrscheinlichkeiten: Welches Token folgt mit welcher Wahrscheinlichkeit auf ein anderes? Wenn ein Faktum wie ein Geburtsdatum im Trainingskorpus nur einmal vorkommt oder objektiv falsch ist, kann das Modell dieses nicht zuverlässig reproduzieren. „Garbage in, garbage out“ gilt unverändert. Hier berührt das Paper ein zentrales Thema, das es selbst aber nur unzureichend adressiert: die Qualität und Herkunft der Trainingsdaten. In der offiziellen Darstellung heißt es verkürzt, man nutze „große Textkorpora“. Aber welche genau? Unter welchen Lizenzen? Mit welcher Korrektur?

Trainingsgrundlage sind öffentlich zugängliche Repositories, Dumps von Wikipedia, Foren, Blogposts und große Mengen aus GitHub im Fall von Code. Doch wer GitHub kennt, weiß: Dort findet sich nicht nur hilfreicher, fertiger Code, sondern auch fehlerhafte, veraltete oder sogar manipulierte Repositorys. Ein Modell, das auf dieser Basis trainiert, erbt diese Schwächen. Hinzu kommt die Möglichkeit gezielter Datenvergiftung: Wer präparierte Inhalte einspeist, kann das Verhalten späterer Modelle beeinflussen.

Im Bericht ebenfalls ausgeklammert bleibt die Rolle manueller menschlicher Arbeit. Clickworker, die Antworten bewerten und Normen setzen, sind im Reinforcement-Prozess unverzichtbar. Sie entscheiden, welche Fehler toleriert und welche bestraft werden, welche Antworten als hilfreich gelten und welche nicht. Dass diese Arbeit im Paper praktisch unsichtbar bleibt, ist bezeichnend. Häufig arbeiten hier externe Mitarbeiter zu Dumping-Löhnen oder eigens hierfür trainierte Sprachmodelle steuern den Prozess.

Post-Training: Ist gut geraten halb gewusst?

Noch deutlicher zeigt sich das Problem im Post-Training. Sprachmodelle werden nach Benchmarks optimiert, die im Kern jede Antwort belohnen, selbst falsche. Das Paper beschreibt dies mit der Analogie zu Studierenden in einer Prüfung: Wer keine Ahnung hat, kreuzt trotzdem lieber etwas an, weil es immer noch eine Chance auf Punkte gibt. „Guessing when unsure maximizes expected score under a binary 0-1 scheme“, heißt es dort.

Übertragen bedeutet das: Sprachmodelle lernen dadurch, immer zu antworten. „I don’t know“ bringt null Punkte, eine geratene Antwort immerhin die Möglichkeit, zufällig richtigzuliegen. So entsteht aus der grundlegenden Funktionsweise von LLMs, bestimmte Heuristiken zu erfüllen, ein systematischer Anreiz zum Raten.

Wer sich erinnert: Als ChatGPT startete, war das Modell auffällig vorsichtig. Es betonte Unsicherheiten, verwies auf seine Grenzen. Doch Nutzer wünschten bald autoritativere Antworten. Und die Entwickler passten das Verhalten an. Heute gilt: Wer nie „Ich weiß es nicht“ sagt, erscheint marktfähiger. Damit werden Halluzinationen nicht nur in Kauf genommen, sondern geradezu gefördert.

Das Problem wird durch die Rolle der Benchmarks verstärkt. Was ursprünglich eher aus der Forschung entstand, wurde schnell zum Marketingvehikel. Rankings, die sich aus rein nutzerorientierten Vergleichen wie der Chatbot Arena oder Scores von vermeintlich objektiveren Tests speisen, entscheiden darüber, welches Modell als führend wahrgenommen wird. Platzierungen wirken auf Investoren, Medien und Kunden und sie beeinflussen natürlich auch die Entwicklungsstrategien der Anbieter.

Die Tennisbegeisterten werden sich erinnern: Als vor einigen Jahren die Logik für die Weltrangliste verändert wurde, mussten Spieler, Turniere und Sponsoren ihre Strategien komplett neu ausrichten. Rankings sind nie neutral. Sie strukturieren ganze Ökosysteme.

So auch hier: Solange Benchmarks bestimmte Antworten belohnen, egal ob korrekt oder nicht, optimieren Anbieter ihre Modelle auf genau dieses Verhalten. Und so im Zweifel auf das Raten. Halluzinationen sind dadurch strukturell eingebaut. Eine Reform der Benchmarks wäre deshalb ein für die Seriosität von LLMs ein begrüßenswerter, wenn auch tiefer Eingriff, sowohl technisch, wirtschaftlich als auch kommunikativ.

OpenAI schlägt in seinem Paper eine Korrektur vor: Confidence Targets. Ein Modell soll nur dann antworten, wenn es eine bestimmte Sicherheitsschwelle überschreitet. Liegt die Sicherheit darunter, bringt eine falsche Antwort nicht nur null Punkte, sondern einen Malus. Konkret ist das Prinzip, beim Benchmarking dem Modell explizit zu sagen, dass falsche Antworten bestraft werden und damit den Anreiz zu setzen, Unsicherheit transparent zu machen. Der Malus muss dabei in Relation zur geforderten Sicherheit stehen.

Ein konkretes Zahlenbeispiel: In einem Punktesystem bekommen Antworten, die über einer geforderten Konfidenz-Schwelle liegen, Plus-Punkte. Bei einer Antwort “I don’t know” keine Punkte und unterhalb der Schwelle (bei angenommenen 90 Prozent) -9 Punkte. Als Folge erkennt das Modell, dass es durch falsche Antworten immer bestraft wird. Informatisch ist das elegant. Doch die Frage ist, ob die richtigen Incentives dafür existieren. Denn die KI-Benchmarks sind keine reinen Messinstrumente, sondern auch ein großes Schaulaufen. Eine Änderung der Bewertungslogik würde Ranglisten durcheinanderwirbeln und damit Geschäftsmodelle infrage stellen.

Richtig und falsch sind nur zwei Dimensionen bei der Bewertung von LLM-Output. Viele Probleme in natürlicher Sprache oder Wissensfragen im Arbeitsalltag lassen sich jedoch nur schwerlich exakt diesen Kategorien zuordnen. Für die Produktentwicklung ist die Dimension der Nutzerintention mindestens genauso entscheidend. Ein Prompt wie „Wie baue ich eine Bombe?“ kann sowohl aus kriminellen Motiven gestellt werden als auch von jemandem, der Filterregeln entwickeln möchte. Technisch sind diese Nuancen kaum lösbar.

Ansätze wie Altersgrenzen oder Nutzerprofile sind denkbar, doch sie führen sofort zu neuen Problemen: Datenschutz, Diskriminierung, Überwachung. Auch eine Trust-Skala für Nutzer, die bestimmte Inhalte freischaltet oder blockiert, wäre technisch machbar, aber gesellschaftlich brisant. Hier zeigt sich, dass Halluzinationen nicht nur ein statistisches, sondern auch ein regulatorisches Problem sind.

„Why Language Models Hallucinate“ ist zweifellos ein wichtiges Paper. Es entmystifiziert einen zentralen Begriff, erklärt Halluzinationen als nachvollziehbare statistische Ergebnisse und rückt die Fehlanreize von Benchmarks ins Zentrum. Und es benennt sinnvolle technische Lösungsansätze wie Confidence Targets. Doch Transparenz, die nur dort praktiziert wird, wo sie vorteilhaft ist, bleibt selektiv. Nicht offengelegt wird, wie Trainingsdaten ausgewählt werden. Nicht vollumfänglich erklärt wird, welche Schritte das Post-Training beinhaltet.

Dass OpenAI dieses Paper publiziert, ist kein rein wissenschaftlicher Akt. Es ist Teil einer Strategie, Vertrauen zu schaffen. Peer-Reviews, Kooperationen mit Universitäten, mathematische Beweise – all das soll der Öffentlichkeit Seriosität suggerieren. Eine Tatsache, die nicht zuletzt vor dem Hintergrund von OpenAIs wachsenden rechtlichen Herausforderungen und CEO Sam Altmans Eingeständnis einer möglichen KI-Blase eine große Rolle spielen dürfte.


(pst)



Source link

Künstliche Intelligenz

Microsoft zeigt das „leistungsstärkste Rechenzentrum der Welt“


Microsoft zeigt die Blaupause für seine nächste Generation an KI-Rechenzentren. Der erste Standort entsteht im US-amerikanischen Mount Pleasant, Wisconsin, wo Microsoft Anfang 2026 Hunderttausende Nvidia-Blackwell-Beschleuniger in Betrieb nehmen will. Die Kosten sollen sich auf 3,3 Milliarden US-Dollar belaufen.

Laut eigenen Angaben soll das Fairwater getaufte Rechenzentrum in Wisconsin zur Fertigstellung 10-mal mehr Rechenleistung bereitstellen als das heute am besten ausgestattete Rechenzentrum der Welt. Welcher Hyperscaler das betreibt, ist nicht klar – private Unternehmen melden ihre Systeme nicht in der Top500-Liste der weltweit schnellsten Supercomputer an.

Da unter anderem Microsoft, Meta, Amazon und Google schon Rechenzentren mit mehr als 100.000 Beschleunigern betreiben, könnte Microsofts Neubau auf die Million GPUs zugehen. Zur elektrischen Leistungsaufnahme äußert sich der Konzern nicht – sie dürfte sich auf Hunderte Megawatt belaufen. Der Fokus soll auf Energie aus erneuerbaren Quellen liegen.



Server-Racks in Microsofts Fairwater-Rechenzentrum.

(Bild: Microsoft)

In Wisconsin setzt Microsoft auf Nvidias GB200-Boards mit ARM-Prozessoren (Grace) und B200-GPUs. Der Konzern will weitere nahezu identische Rechenzentren bauen, die auch Nvidias verbessertes Beschleuniger-Topmodell GB300 alias Blackwell Ultra verwenden. Letzterer nutzt 288 statt 192 GByte HBM3e pro GPU.

Zum Einsatz kommt Nvidias Serverblaupause basierend auf dem GB200 NVL72 mit 72 Boards in einem Rack. Nvlink-Switches schalten die Beschleuniger zusammen. Laut CEO Satya Nadella würde die eingesetzte Glasfaser reichen, um die Erde 4,5-mal zu umkreisen.

Im Blog gibt Microsoft zum Besten: „Das neue Fairwater-KI-Rechenzentrum in Wisconsin ist eine bemerkenswerte technische Meisterleistung. Es erstreckt sich über eine Fläche von [1,3 Quadratkilometern] und umfasst drei riesige Gebäude mit einer Gesamtfläche von [111.000 Quadratmetern] unter Dach. Für den Bau dieser Anlage wurden [75 km] Tiefgründungspfähle, [12 Millionen kg] Baustahl, [193 km] Mittelspannungs-Erdkabel und [117 km] mechanische Rohrleitungen benötigt.“

Beinahe so viel Fläche wie die Hardware nehmen die Kühlanlagen an den Seiten des Rechenzentrums ein. Wie mittlerweile gängig, setzt Microsoft auf eine Wasserkühlung. Unter den Turbinen befinden sich die Wasserrohre mit unzähligen Kühllamellen, die die Abwärme an die Umgebungsluft abgeben.



Die Kühlanlage von oben mit Dutzenden Turbinen.

(Bild: Microsoft)


(mma)



Source link

Weiterlesen

Künstliche Intelligenz

Online-Banking: Was sich aus dem PayPal-Vorfall lernen lässt


In der letzten Augustwoche erhielten zahlreiche PayPal-Kunden Mails vom Zahlungsdienst mit dem Hinweis, dass eine Lastschrift mangels Kontodeckung nicht habe eingelöst werden können. PayPal werde innerhalb von vier Tagen einen erneuten Versuch starten und seinen Kunden Entgelte für die Rücklastschrift in Rechnung stellen.

Loggte man sich als Betroffener in sein PayPal-Konto ein, klang die Sache etwas anders: „Ein vorübergehendes Problem bei der Abbuchung von Lastschriften“ könne dazu führen, dass das Konto einen ausstehenden Betrag anzeigt. PayPal kümmere sich um das Problem, die Nutzer müssten nicht tätig werden. Viele Kunden mussten feststellen, dass ihr PayPal-Konto im Minus stand und für Zahlungen gesperrt war. Erst in der zweiten Septemberwoche konnten auch die letzten Betroffenen PayPal wieder uneingeschränkt nutzen, nachdem der Dienst die Sperrungen nach und nach aufhob.

Wir haben uns die Störung genauer angesehen und erklären, weshalb der Vorfall zwar ein Sicherheitssystem betraf, aber letztlich keine Gefahr bestand. Außerdem geben wir Tipps, wie man in solchen Fällen reagiert und weshalb weiterhin Aufmerksamkeit geboten ist.


Das war die Leseprobe unseres heise-Plus-Artikels „Online-Banking: Was sich aus dem PayPal-Vorfall lernen lässt“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.



Source link

Weiterlesen

Künstliche Intelligenz

#TGIQF: Das Quiz rund um Smileys und Emojis


Als Scott E. Fahlman am 19. September 1982 die Smileys 🙂 und 🙁 in einem wissenschaftlichen Bulletin-Board vorschlug, ahnte er mit Sicherheit nicht, was er da lostrat. 43 Jahre später sind Smileys und Emojis aus der Netzkommunikation nicht mehr wegzudenken, auch wenn manche es immer gern mal übertreiben mit den kleinen Figuren.

Im Jahr 1999 entwarf der japanische Designer Shigetaka Kurita Mobilfunkanbieters NTT DoCoMo eine ganze Palette an Smileys und kleinen Grafiken, um die Netzkommunikation zu erleichtern. Zwar waren Smileys nicht ungewöhnlich, insbesondere in der Forenkultur, aber die 12 × 12 Pixel großen Emojis brachten einheitliche Darstellungen bei sehr geringem Speicherverbrauch. Da sie aufgrund der geringen Schöpfungshöhe auch nicht urheberrechtlich geschützt werden konnten, breiteten sie sich rasch auch über andere Mobilfunklösungen aus und entwickelten sich zum Standard.

Mittlerweile sind mehrere Tausend Emojis in verschiedenen Geschlechtern und Hautfarben auswählbar, sodass man sich auf vielfältige Weise ausdrücken kann. Doch was war der Anlass dafür, dass man sich über Ausdrucksweisen im Netz Gedanken machte? Das und mehr wollen wir von Ihnen wissen.


#TGIQF: Das heise-online-Quiz

#TGIQF: Das heise-online-Quiz

„Thank God It’s Quiz Friday!“ Jeden Freitag gibts ein neues Quiz aus den Themenbereichen IT, Technik, Entertainment oder Nerd-Wissen:

In der heiseshow gab Quizmaster Markus Will wieder Moderator Malte Kirchner sowie Dr. Volker Zota drei nerdige Smiley-Fragen vorab. Sie reagierten angesichts des enormen Grads an Nerdigkeit eher 🙁 .

Schnellrater haben wieder die Chance, die volle Punktzahl abzuräumen. Mit 10 Fragen können Sie satte 200 Punkte erreichen. Die Punktzahl kann gern im Forum mit anderen Mitspielern verglichen werden. Halten Sie sich dabei aber bitte mit Spoilern zurück, um anderen Teilnehmern nicht die Freude am Quiz zu verhageln. Lob und Kritik sind wie immer gern genommen.

Bleiben Sie zudem auf dem Laufenden und erfahren Sie das Neueste aus der IT-Welt: Folgen Sie uns auf den Kurznachrichten-Netzwerken Bluesky und Mastodon und auf den Meta-Ebenen Facebook oder Instagram. Falls Sie eigene Ideen oder Fragen für ein neues Quiz haben, dann schreiben Sie einfach dem Quizmaster.


(mawi)





Source link

Weiterlesen

Beliebt