Künstliche Intelligenz

Honor 400 Pro im Test: Hervorragendes Smartphone mit Top-Kamera

Das Honor 400 Pro mit starker Kamera, Snapdragon 8 Gen 3 und KI-Features ist beinahe ein Flaggschiff. Wie gut das Smartphone für knapp 800 Euro ist, zeigt der Test.

Die Number-Reihe steht bei Honor traditionell für gut ausgestattete Smartphones der Mittel- und Oberklasse. Das Pro-Modell legt dabei einmal mehr den Schwerpunkt auf die Kamera. Mit dem Honor 400 Pro bringt der Hersteller ein nahezu vollwertiges Flaggschiff auf den Markt, das nur knapp hinter den aktuellen Geräten der Magic-Serie zurückbleibt. Allerdings kratzt die UVP auch an der Premiumklasse.

Als Prozessor kommt der flotte Snapdragon 8 Gen 3 aus dem Vorjahr zum Einsatz. Die Triple-Kamera mit Teleobjektiv liefert solide Ergebnisse, ergänzt um einige spannende KI-Funktionen. Wie gut das abgespeckte Flaggschiff im Alltag wirklich abschneidet, klärt unser Test.

Design

Das Honor 400 Pro bietet ein sehr elegantes Design. Die Verarbeitung ist erstklassig: Die Tasten sitzen fest und bieten einen klar definierten Druckpunkt. Die Linienführung des Gehäuses ist sauber, ohne scharfe Kanten, und die leicht abgerundeten Ränder sowie das 2,5D-Display sorgen für eine angenehme Haptik. Es liegt gut in der Hand, verrutscht nicht so leicht und ist relativ unempfindlich gegenüber Fingerabdrücken.

Die Rückseite besteht aus Glas, der Rahmen aus Metall – beides verleiht dem Gerät eine edle Anmutung. Trotz seiner wuchtigen Abmessungen von 160,8 × 76,1 × 8,1 mm liegt das Smartphone mit 205 g noch vergleichsweise leicht in der Hand. Auffällig ist das markante Kameraelement auf der Rückseite: In einem umgedrehten Trapez mit abgerundeten Kanten sind die drei Objektive samt LED-Blitz untergebracht – sehr präsent, aber stilvoll integriert.

Hervorzuheben ist die IP69-Zertifizierung. Diese Schutzklasse ist bei Smartphones noch selten und bedeutet, dass das Gerät nicht nur gegen Staub, sondern auch gegen starkes Strahlwasser und sogar Hochdruckreinigung geschützt ist – ideal für besonders anspruchsvolle Einsatzbedingungen.

Honor 400 Pro – Bilder

Honor 400 Pro

Display

Das Honor 400 Pro verfügt über ein 6,7 Zoll großes AMOLED-Display mit einer Auflösung von 2800 × 1280 Pixeln. Mit einer Pixeldichte von 460 PPI bietet es eine messerscharfe Darstellung. Die adaptive Bildwiederholrate liegt zwischen 60 und 120 Hz und passt sich automatisch an die jeweilige Nutzungssituation an.

Laut Hersteller erreicht das Display eine maximale Helligkeit von bis zu 5000 Nits, was auch bei direkter Sonneneinstrahlung eine einwandfreie Ablesbarkeit gewährleistet. Hohe Kontraste, satte Schwarzwerte und eine ausgewogene Farbdarstellung runden den positiven Gesamteindruck ab.

Die Frontkamera sitzt in einer etwas breiteren, ovalen Punch-Hole-Notch, da sie neben der Selfie-Kamera eine zweite Linse für eine verbesserte 3D-Gesichtserkennung integriert. Das Design erinnert in Ansätzen an Apples Dynamic Island, fällt jedoch kompakter aus. Im Android-Umfeld stellt diese Lösung eine Besonderheit dar.

Kamera

Das Honor 400 Pro ist mit einem leistungsstarken Triple-Kamera-System ausgestattet. Die Hauptkamera bietet eine Auflösung von 200 Megapixeln (f/1.9) und verfügt über optische Bildstabilisierung (OIS) sowie Phasenvergleichs-Autofokus. Ergänzt wird sie durch ein 50-Megapixel-Teleobjektiv (f/2.4) mit ebenfalls OIS und eine 12-Megapixel-Ultraweitwinkelkamera (f/2.2).

Bei Tageslicht liefert die Hauptkamera exzellente Aufnahmen mit hoher Detailtreue, ausgewogener Dynamik und realistischen Farben. Auch die Telelinse überzeugt mit scharfen, kontrastreichen Bildern und ist für Porträts und entfernte Motive gut geeignet. Nachtaufnahmen gelingen ebenfalls – trotz gelegentlichem Bildrauschen bleibt die Bildqualität insgesamt überzeugend. Die Ultraweitwinkelkamera kann in puncto Schärfe, Bilddetails und Farbdynamik nicht ganz mit den beiden anderen Modulen mithalten, liefert aber dennoch brauchbare Ergebnisse.

Nutzer können zwischen drei Bildprofilen wählen: „Natürlich“, „Dynamisch“ und „Authentisch“. Diese beeinflussen Farbsättigung, Kontraste sowie die Wiedergabe von hellen und dunklen Bildbereichen. Manchmal wirken Fotos aber nicht mehr natürlich. Für Porträtaufnahmen stehen zudem drei Filter des bekannten Fotostudios Harcourt zur Verfügung, die bereits aus dem Vorgänger Honor 200 Pro bekannt sind. Eine KI-gestützte Optimierung sorgt zusätzlich für verbesserte Hauttöne und feinere Details bei Gesichtern.

Videos sind in 4K mit bis zu 60 Bildern pro Sekunde möglich. Auch HDR-Modi für kontrastreiche Szenen sind integriert. Damit bietet das Honor 400 Pro eine Kameraausstattung, die sich in der oberen Mittelklasse sehen lassen kann.

Honor 400 Pro – Originalaufnahmen

Ausstattung

Das Honor 400 Pro ist mit dem Qualcomm Snapdragon 8 Gen 3 ausgestattet, einem High-End-Prozessor aus dem Jahr 2024. Trotz der inzwischen verfügbaren Nachfolgegeneration liefert der Chip noch immer mehr als genügend Leistung für alle Aufgaben – ob im Alltag, beim Multitasking oder bei grafikintensiven Spielen. Das System reagiert im Test durchweg flüssig und verzögerungsfrei.

In den Benchmarks bestätigt das Gerät seine starke Performance: Bei PCmark erreicht es rund 18.000 Punkte, bei 3Dmark Wild Life Extreme knapp 4500 Punkte – Werte, die es für die kommenden Jahre zukunftssicher machen.

Auch bei Speicher und Arbeitsspeicher zeigt sich das Honor 400 Pro großzügig. Es ist standardmäßig mit 512 GB internem Speicher ausgestattet, eine Erweiterung per microSD ist allerdings nicht möglich. Hinzu kommen 12 GB RAM, die für eine reibungslose Nutzung sorgen.

Zur biometrischen Entsperrung bietet das Honor 400 Pro zwei schnelle und zuverlässige Optionen: Dazu gehört ein im Display integrierter Fingerabdrucksensor sowie eine 3D-Gesichtserkennung, die mithilfe einer zweiten Frontkamera umgesetzt wird. Letztere ist deutlich sicherer als die herkömmliche 2D-Gesichtserkennung, wie sie bei vielen anderen Android-Smartphones zum Einsatz kommt.

Bei den Schnittstellen zeigt sich das Gerät auf der Höhe der Zeit: Wi-Fi 7, Bluetooth 5.4, NFC und 5G gehören zur Ausstattung. Die Stereo-Lautsprecher liefern einen klaren und kräftigen Klang – für ein Smartphone dieser Klasse absolut angemessen.

Ein großer Schwachpunkt bleibt jedoch: Honor setzt beim USB-Anschluss lediglich auf USB-C 2.0. Angesichts der ansonsten hochwertigen Ausstattung ist das kaum nachvollziehbar – insbesondere im Hinblick auf Datentransferraten.

Software

Auf dem Honor 400 Pro läuft Android 15 mit der Bedienoberfläche Magic OS in Version 9, die optisch stark an iOS und Huaweis EMUI erinnert. Einen App-Drawer gibt es nicht. Das Einstellungsmenü ist zweigeteilt: Benachrichtigungen werden zentral von oben, das Kontrollzentrum vom rechten oberen Rand aufgerufen.

Zum Testzeitpunkt stammt der Sicherheits-Patch aus dem Mai und ist somit noch hinreichend aktuell. Honor verspricht sechs Jahre lang Software- und Sicherheits-Updates – ein erfreulich langer Zeitraum für ein Android-Gerät.

Magic OS bietet zudem praktische Funktionen wie eine Multi-Window-Ansicht, eine seitliche App-Leiste für Schnellzugriffe sowie das „Magic Portal“, mit dem sich Inhalte wie Adressen oder Texte direkt in passende Apps übertragen lassen, etwa in Google Maps oder Messenger. Auch die „Knöchel-Geste“ zur Markierung von Bildausschnitten ist an Bord – ähnlich wie „Circle to Search“ von Samsung, in der Praxis aber weniger zuverlässig.

Ein Highlight ist das neue KI-Foto-Feature, das aus einem einzelnen Bild ein kurzes animiertes Video erzeugt – etwa im Stil von Stop-Motion. Besonders bei Nahaufnahmen, etwa von Miniaturfiguren, entstehen beeindruckende Effekte: Die KI simuliert sogar einen Finger, der die Figuren scheinbar bewegt. Ergänzt wird das durch weitere KI-Funktionen wie Google Gemini, einen Fotoradierer, Nachschärfung von Zoomaufnahmen und automatische Zusammenfassungen in der Notizen-App.

Es gibt jedoch eine Vielzahl vorinstallierter Honor-Apps, um die Google-Lösungen zu verdrängen. So ist etwa die hauseigene Kalender-App weniger ausgereift als das Google-Pendant, und Synchronisierungen funktionieren teilweise verzögert.

Akku

Der Silizium-Kohlenstoff-Akku des Honor 400 Pro bietet trotz des schlanken Gehäuses eine beeindruckende Kapazität von 5300 mAh – ein guter Indikator für lange Laufzeiten. Diese Technologie ermöglicht kompaktere Akkus, weil diese eine höhere Energiedichte haben und somit mehr Energie auf gleichem Raum speichern können.

Unsere Messungen bestätigen diesen Eindruck: Im PCmark Battery Test erreichte das Gerät eine Laufzeit von über 14 Stunden im simulierten Dauerbetrieb – ein ausgezeichnetes Ergebnis für ein Smartphone dieser Leistungsklasse. Einen Tag sollte es also problemlos ohne Netzteil schaffen.

Das Honor 400 Pro bietet beeindruckende Ladeleistungen: Über Kabel sind mit Honor Supercharge bis zu 100 Watt möglich, kabelloses Laden wird mit bis zu 50 Watt unterstützt (Honor Wireless Supercharge). Ein Netzteil liegt dem Gerät jedoch nicht bei – wer die volle Ladegeschwindigkeit nutzen möchte, muss entsprechendes Zubehör separat erwerben. Mit dem passenden Ladegerät ist der Akku kabelgebunden in knapp über 30 Minuten vollständig geladen, kabellos dauert es bei 50 Watt etwa eine Stunde.

Preis

Die UVP liegt – wie schon beim Vorgänger – bei stolzen 799 Euro und sprengt damit den Rahmen der gehobenen Mittelklasse. Die Preise dürften jedoch weiter fallen: Aktuell ist das Honor 400 Pro bereits ab etwa 760 Euro erhältlich. Verfügbar ist das Gerät in den Farben Anthrazit und Grau.

Fazit

Mit dem Honor 400 Pro ist dem chinesischen Hersteller ein überzeugendes Oberklasse-Smartphone gelungen. Die hochwertige Verarbeitung, die starke Triple-Kamera und die hervorragende Akkulaufzeit sprechen für sich. Auch wenn der verbaute Snapdragon 8 Gen 3 nicht mehr der neueste High-End-Chip ist, liefert er weiterhin für die nächsten Jahre mehr als genug Leistung für alle Anwendungen – vom Alltag bis zum Gaming.

Besonders gefallen haben uns die KI-Funktionen, etwa das neue Feature, das aus einem einzigen Foto animierte Kurzvideos erstellt – kreativ und beeindruckend umgesetzt. Wer nicht über 1000 Euro für ein Flaggschiff ausgeben möchte, findet im Honor 400 Pro eine attraktive Alternative für unter 800 Euro.

Abzüge gibt es für die veraltete USB-C-2.0-Schnittstelle – in diesem Preisbereich kaum nachvollziehbar. Auch die Vielzahl vorinstallierter Apps stört etwas – viele davon können qualitativ nicht mit den Google-Originalen mithalten. Perfekt ist das Honor 400 Pro also nicht, doch es bietet ein starkes Gesamtpaket und präsentiert sich als gelungenes Sub-Flaggschiff. Eine clevere Wahl für alle, die Wert auf Design, Kamera und Performance legen, ohne dafür vierstellige Beträge ausgeben zu wollen.

Source link

Verwandte Themen:Android Hervorragendes honor MIT Pro smartphone test TopKamera

Up Next

Vor dem zehnten Testflug: Starship explodiert am Boden

Nicht verpassen

Steam nativ für Apple Silicon: Besser zocken auf dem Mac

Künstliche Intelligenz

Ausgezeichnete VR-Spiele gratis ausprobieren: VR Forever Fest startet auf Steam

Das erstmals veranstaltete „VR Forever Festival“ auf Steam läuft vom 18. bis 23. September 2025 und versteht sich als kuratiertes Schaufenster für hochwertige VR-Titel. Insgesamt nehmen über 90 VR-Studios teil, darunter namhafte Vertreter wie Resolution Games, nDreams, Owlchemy Labs oder die Flat2VR Studios. Veranstaltet wird das Event vom VR-Label Creature und der Agentur Future Friends Games.

Auch in der Jury sitzen bekannte Namen aus der VR-Branche. Die Auswahl der Preisträger erfolgte durch ein achtköpfiges Gremium, in dem unter anderem Ed Lago und Doug North Cook von Creature, Owlchemy-Labs-Chef Andrew Eiche und Henry Stockdale vom Branchen-Blog UploadVR sitzen.

Neben Rabatten und spielbaren Demos will die Veranstaltung vor allem herausragende VR-Spiele würdigen. Die „VR Forever Awards 2025“ wurden in sechs Kategorien vergeben – unter anderem für das Spiel des Jahres, das beste soziale Erlebnis und das meist erwartete Spiel.

Spiel des Jahres wird ein Knet-Abenteuer

Als bestes VR-Spiel des Jahres zeichnete die Jury „The Midnight Walk“ aus – ein düsteres Stop-Motion-Abenteuer mit Knet-Animationen, Rätseln und surrealen Landschaften. Den Titel „meist erwartetes Spiel“ sicherte sich das VR-Abenteuer „Reach“, das auf physikbasierte Action mit vollständiger Körperdarstellung und cineastischer Inszenierung setzt. Entwickelt wird Reach von nDreams. Die Veröffentlichung ist für den 16. Oktober 2025 geplant.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

YouTube-Video immer laden

„Walkabout Mini Golf VR“ erhielt die Auszeichnung für das beste soziale Erlebnis. Der beliebte VR-Hit überzeugt durch realistische Physik, stimmungsvolle Fantasiekurse und eine lebendige Community. Für Einzelspieler wurde der Klassiker „Moss: Book II“ prämiert – ein Plattform-Abenteuer in Diorama-Perspektive, in dem Spieler der Maus Quill auf eine märchenhaft erzählte Reise folgen. Als „All Time Classic“ wurde das erst kürzlich für Apple Vision Pro veröffentlichte „Job Simulator“ geehrt – ein humorvolles VR-Sandbox-Spiel, in dem Spieler in einem Roboter-Museum menschliche Berufe wie Koch oder Automechaniker simulieren.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

YouTube-Video immer laden

Mit „The Under Presents“ wurde zudem ein experimentelles VR-Theater für seine Originalität als „Hidden Gem“ ausgezeichnet. Spieler bewegen sich in einer surrealen Bühnenwelt, treffen live agierende Schauspieler und erleben nonlineare Geschichten ohne feste Ziele.

Unsere Empfehlung: Vier Demos zum Ausprobieren

Begleitend zu den Auszeichnungen bietet das Festival über 130 VR-Spiele, viele davon mit spielbarer Demo. Darunter „Wanderer: The Fragments of Fate“ – ein grafisch opulentes Zeitreise-Abenteuer mit Eye-Tracking, realistischem Körper-Avatar und interaktiven Rätseln in historischen Epochen. Ebenfalls anspielbar: das düstere Knetanimations-Abenteuer und als Spiel des Jahres ausgezeichnete „The Midnight Walk“, das adrenalingetränkte Sci-Fi-Musik-Actionspiel „Thrasher“ sowie das gemütliche Modellbau-Puzzle „Puzzling Places“ vom Berliner Studio Realities.io.

(joe)

Source link

Künstliche Intelligenz

Wie OpenAI erklärt, warum LLMs bei völliger Ahnungslosigkeit sicher auftreten

Der Begriff Halluzination ist für den Fachbereich KI vergleichsweise jung, verbreitete sich aber seit seinem Auftauchen vor wenigen Jahren rasch. Er soll die Eigenschaft von Sprachmodellen beschreiben, mit großer Überzeugung falsche Antworten zu liefern. Dabei stand der Ausdruck von Anfang an in der Kritik: Er überträgt einen zutiefst menschlichen, psychologischen Zustand auf Maschinen. Damit hat er die Debatte mehr verschleiert als erhellt.

Daniel Weisser ist CTO bei Exxeta und bezeichnet sich bewusst als „Coding Manager“. Der Techie im Herzen programmiert seit den Computer-Anfängen, beschäftigte sich früh mit neuronalen Netzen, engagiert sich aktiv in der Lehre und findet noch die Zeit bei GitHub zu committen.

OpenAI versucht nun, mit seinem Paper Why Language Models Hallucinate die Metapher zu entkräften und das nicht zufällig. Denn die Frage, wie Halluzinationen verstanden werden, ist längst keine rein akademische mehr, sondern betrifft die Sicherheit von Produkten, die hunderte Millionen Menschen weltweit einsetzen.

Die wichtigsten Erkenntnisse

Das Paper setzt zwei Schwerpunkte: Zum einen betont es die statistische Unvermeidbarkeit bestimmter Fehler bereits im Pre‑Training. Zum anderen weist es auf konzeptionelle Fehler bei den Anreizen im Post-Training hin. Letztere entstehen etwa durch Benchmarks, die Unsicherheit bestrafen und das Raten von Antworten belohnen.

Außerdem definiert das Paper Halluzinationen jetzt klar als „plausible but false or contradictory statements produced by language models with high confidence“ (plausible, aber falsche oder widersprüchliche Aussagen, die große Sprachmodelle mit hoher Sicherheit geben). Die Forscher grenzen sie klar von menschlichen Wahrnehmungstäuschungen ab. Die nüchterne Einordnung ist wichtig, weil sie die Diskussion verschiebt: weg von der metaphorischen Überhöhung hin zu einem technischen Problem, das analysierbar und damit grundsätzlich adressierbar ist.

Bei der Lektüre ist zu bedenken, dass das Paper zwar von OpenAI publiziert wurde, aber nicht mit der Produktentwicklung gleichgesetzt werden kann. Natürlich ist hier eine, wenn auch indirekte, Rückkopplung zu vermuten. Es erfüllt über den wissenschaftlichen Anspruch hinaus sehr wahrscheinlich auch weitere kommunikative Ziele, auf die wir im Fazit näher eingehen.

Pre-Training: Datenqualität nicht allein ausschlaggebend

Der Beitrag von OpenAI vergegenwärtigt den Lesern, dass Sprachmodelle keine absoluten Wahrheiten lernen, sondern Wahrscheinlichkeiten: Welches Token folgt mit welcher Wahrscheinlichkeit auf ein anderes? Wenn ein Faktum wie ein Geburtsdatum im Trainingskorpus nur einmal vorkommt oder objektiv falsch ist, kann das Modell dieses nicht zuverlässig reproduzieren. „Garbage in, garbage out“ gilt unverändert. Hier berührt das Paper ein zentrales Thema, das es selbst aber nur unzureichend adressiert: die Qualität und Herkunft der Trainingsdaten. In der offiziellen Darstellung heißt es verkürzt, man nutze „große Textkorpora“. Aber welche genau? Unter welchen Lizenzen? Mit welcher Korrektur?

Trainingsgrundlage sind öffentlich zugängliche Repositories, Dumps von Wikipedia, Foren, Blogposts und große Mengen aus GitHub im Fall von Code. Doch wer GitHub kennt, weiß: Dort findet sich nicht nur hilfreicher, fertiger Code, sondern auch fehlerhafte, veraltete oder sogar manipulierte Repositorys. Ein Modell, das auf dieser Basis trainiert, erbt diese Schwächen. Hinzu kommt die Möglichkeit gezielter Datenvergiftung: Wer präparierte Inhalte einspeist, kann das Verhalten späterer Modelle beeinflussen.

Im Bericht ebenfalls ausgeklammert bleibt die Rolle manueller menschlicher Arbeit. Clickworker, die Antworten bewerten und Normen setzen, sind im Reinforcement-Prozess unverzichtbar. Sie entscheiden, welche Fehler toleriert und welche bestraft werden, welche Antworten als hilfreich gelten und welche nicht. Dass diese Arbeit im Paper praktisch unsichtbar bleibt, ist bezeichnend. Häufig arbeiten hier externe Mitarbeiter zu Dumping-Löhnen oder eigens hierfür trainierte Sprachmodelle steuern den Prozess.

Post-Training: Ist gut geraten halb gewusst?

Noch deutlicher zeigt sich das Problem im Post-Training. Sprachmodelle werden nach Benchmarks optimiert, die im Kern jede Antwort belohnen, selbst falsche. Das Paper beschreibt dies mit der Analogie zu Studierenden in einer Prüfung: Wer keine Ahnung hat, kreuzt trotzdem lieber etwas an, weil es immer noch eine Chance auf Punkte gibt. „Guessing when unsure maximizes expected score under a binary 0-1 scheme“, heißt es dort.

Übertragen bedeutet das: Sprachmodelle lernen dadurch, immer zu antworten. „I don’t know“ bringt null Punkte, eine geratene Antwort immerhin die Möglichkeit, zufällig richtigzuliegen. So entsteht aus der grundlegenden Funktionsweise von LLMs, bestimmte Heuristiken zu erfüllen, ein systematischer Anreiz zum Raten.

Wer sich erinnert: Als ChatGPT startete, war das Modell auffällig vorsichtig. Es betonte Unsicherheiten, verwies auf seine Grenzen. Doch Nutzer wünschten bald autoritativere Antworten. Und die Entwickler passten das Verhalten an. Heute gilt: Wer nie „Ich weiß es nicht“ sagt, erscheint marktfähiger. Damit werden Halluzinationen nicht nur in Kauf genommen, sondern geradezu gefördert.

Das Problem der Benchmarks

Das Problem wird durch die Rolle der Benchmarks verstärkt. Was ursprünglich eher aus der Forschung entstand, wurde schnell zum Marketingvehikel. Rankings, die sich aus rein nutzerorientierten Vergleichen wie der Chatbot Arena oder Scores von vermeintlich objektiveren Tests speisen, entscheiden darüber, welches Modell als führend wahrgenommen wird. Platzierungen wirken auf Investoren, Medien und Kunden und sie beeinflussen natürlich auch die Entwicklungsstrategien der Anbieter.

Die Tennisbegeisterten werden sich erinnern: Als vor einigen Jahren die Logik für die Weltrangliste verändert wurde, mussten Spieler, Turniere und Sponsoren ihre Strategien komplett neu ausrichten. Rankings sind nie neutral. Sie strukturieren ganze Ökosysteme.

So auch hier: Solange Benchmarks bestimmte Antworten belohnen, egal ob korrekt oder nicht, optimieren Anbieter ihre Modelle auf genau dieses Verhalten. Und so im Zweifel auf das Raten. Halluzinationen sind dadurch strukturell eingebaut. Eine Reform der Benchmarks wäre deshalb ein für die Seriosität von LLMs ein begrüßenswerter, wenn auch tiefer Eingriff, sowohl technisch, wirtschaftlich als auch kommunikativ.

OpenAIs Lösungsvorschlag: Confidence Targets

OpenAI schlägt in seinem Paper eine Korrektur vor: Confidence Targets. Ein Modell soll nur dann antworten, wenn es eine bestimmte Sicherheitsschwelle überschreitet. Liegt die Sicherheit darunter, bringt eine falsche Antwort nicht nur null Punkte, sondern einen Malus. Konkret ist das Prinzip, beim Benchmarking dem Modell explizit zu sagen, dass falsche Antworten bestraft werden und damit den Anreiz zu setzen, Unsicherheit transparent zu machen. Der Malus muss dabei in Relation zur geforderten Sicherheit stehen.

Ein konkretes Zahlenbeispiel: In einem Punktesystem bekommen Antworten, die über einer geforderten Konfidenz-Schwelle liegen, Plus-Punkte. Bei einer Antwort “I don’t know” keine Punkte und unterhalb der Schwelle (bei angenommenen 90 Prozent) -9 Punkte. Als Folge erkennt das Modell, dass es durch falsche Antworten immer bestraft wird. Informatisch ist das elegant. Doch die Frage ist, ob die richtigen Incentives dafür existieren. Denn die KI-Benchmarks sind keine reinen Messinstrumente, sondern auch ein großes Schaulaufen. Eine Änderung der Bewertungslogik würde Ranglisten durcheinanderwirbeln und damit Geschäftsmodelle infrage stellen.

Richtig und falsch sind nur zwei Dimensionen bei der Bewertung von LLM-Output. Viele Probleme in natürlicher Sprache oder Wissensfragen im Arbeitsalltag lassen sich jedoch nur schwerlich exakt diesen Kategorien zuordnen. Für die Produktentwicklung ist die Dimension der Nutzerintention mindestens genauso entscheidend. Ein Prompt wie „Wie baue ich eine Bombe?“ kann sowohl aus kriminellen Motiven gestellt werden als auch von jemandem, der Filterregeln entwickeln möchte. Technisch sind diese Nuancen kaum lösbar.

Ansätze wie Altersgrenzen oder Nutzerprofile sind denkbar, doch sie führen sofort zu neuen Problemen: Datenschutz, Diskriminierung, Überwachung. Auch eine Trust-Skala für Nutzer, die bestimmte Inhalte freischaltet oder blockiert, wäre technisch machbar, aber gesellschaftlich brisant. Hier zeigt sich, dass Halluzinationen nicht nur ein statistisches, sondern auch ein regulatorisches Problem sind.

Fazit: Mit interessierter Vorsicht zu genießen

„Why Language Models Hallucinate“ ist zweifellos ein wichtiges Paper. Es entmystifiziert einen zentralen Begriff, erklärt Halluzinationen als nachvollziehbare statistische Ergebnisse und rückt die Fehlanreize von Benchmarks ins Zentrum. Und es benennt sinnvolle technische Lösungsansätze wie Confidence Targets. Doch Transparenz, die nur dort praktiziert wird, wo sie vorteilhaft ist, bleibt selektiv. Nicht offengelegt wird, wie Trainingsdaten ausgewählt werden. Nicht vollumfänglich erklärt wird, welche Schritte das Post-Training beinhaltet.

Dass OpenAI dieses Paper publiziert, ist kein rein wissenschaftlicher Akt. Es ist Teil einer Strategie, Vertrauen zu schaffen. Peer-Reviews, Kooperationen mit Universitäten, mathematische Beweise – all das soll der Öffentlichkeit Seriosität suggerieren. Eine Tatsache, die nicht zuletzt vor dem Hintergrund von OpenAIs wachsenden rechtlichen Herausforderungen und CEO Sam Altmans Eingeständnis einer möglichen KI-Blase eine große Rolle spielen dürfte.

(pst)

Source link

Künstliche Intelligenz

Agibot Lingxi X2: Humanoider Roboter schafft Webster-Flip

Das chinesische Robotikunternehmen Agibot hat seinem humanoiden Roboter Lingxi X2 die Ausführung eines Webster-Flips beigebracht. Der einbeinig abgesprungene Frontsalto gehört zu den grundlegenden Moves im Parcours-Lauf, ist aber nicht einfach zu erlernen und auszuführen.

Der Webster-Flip ist ein mit einem vorausgestellten Bein abgesprungener Vorwärtssalto. Das hintere Bein unterstützt dabei die Rotationsbewegung nach vorn. Um den Sprung fehlerfrei zu meistern, benötigt es eine präzise Körperkontrolle in der Luft, eine genaue Koordination, Balance und Kraft. Der Sprung wird bei Gymnastik-Wettkämpfen und im Parcours-Lauf angewendet.

Körperbeherrschung

Für humanoide Roboter stellt der Webster-Flip eine große Schwierigkeit dar. Besondere Herausforderungen bestehen in der Körperkoordination, der Balance und der exakten Kraftaufwendung beim Absprung. Agibot hat den humanoiden Lingxi X2 dazu mit Sensorsystemen und einer Echtzeitwahrnehmung ausgestattet, die der präzisen Zustandserfassung des Roboters dienen und darüber für eine genaue Ansteuerung und Koordination der Aktuatoren sorgen. Der Roboter verfügt außerdem über eine Mehrgelenk-Kraftsteuerung. Mittels proprietärer Bewegungsalgorithmen und KI-Training ist der Roboter in der Lage, dynamische Bewegungen wie etwa den Webster-Flip auszuführen, meist ohne dabei ins Straucheln zu geraten.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

YouTube-Video immer laden

Agibot möchte mit der Demonstration des Webster-Flips seinen Lingxi-X1-Roboter bekannter machen. Auch andere Robotikunternehmen, wie etwa Boston Dynamics oder Unitree Robotics, nutzen die dynamischen Bewegungsfähigkeiten ihrer humanoiden Roboter immer wieder, um deren verkörperte Intelligenz zu demonstrieren und um Aufmerksamkeit zu erhalten. Zur Wahrheit gehört aber auch, dass die in Videos gezeigten Bewegungsabläufe etwa für Vorwärts- und Rückwärtssalti oder andere akrobatische Einlagen nicht immer funktionieren und in den Videos oft nur gezeigt wird, wenn etwas geklappt hat.

Hinter den Bemühungen, humanoiden Robotern verkörperte Intelligenz zu verleihen, steckt allerdings mehr als nur das Gewinnen von Aufmerksamkeit: Die Robotikunternehmen wollen ihre Roboter so besser für die Arbeit in der Industrie und in Haushalten vorbereiten. Dort müssen sie präzise Bewegungen durchführen können. Das setzt eine exakte Beherrschung des Körpers voraus.

Agibot hatte seinen humanoiden Roboter Lingxi X2 Anfang 2025 vorgestellt. Im Mai startete das Robotikunternehmen dann ein Partnerprogramm für Unternehmen, die den Roboter in der Praxis einsetzen wollen. Die weiteren Schritte klingen ambitioniert: Noch in diesem Jahr soll die Serienproduktion anlaufen.

(olb)

Source link

Der ultimative Guide für eine unvergessliche Customer Experience

UX/UI & Webdesignvor 1 Monat

Der ultimative Guide für eine unvergessliche Customer Experience

UX/UI & Webdesignvor 3 Wochen

Adobe Firefly Boards › PAGE online

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Social Mediavor 1 Monat

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Posit stellt Positron vor: Neue IDE für Data Science mit Python und R

Entwicklung & Codevor 4 Wochen

Posit stellt Positron vor: Neue IDE für Data Science mit Python und R

EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events

Entwicklung & Codevor 2 Wochen

EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events

Fake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online

UX/UI & Webdesignvor 3 Tagen

Fake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online

10.000 Euro Tickets? Kann man machen – aber nur mit diesem Trick

Digital Business & Startupsvor 3 Monaten

10.000 Euro Tickets? Kann man machen – aber nur mit diesem Trick

80 % günstiger dank KI – Startup vereinfacht Klinikstudien: Pitchdeck hier

Digital Business & Startupsvor 3 Monaten

80 % günstiger dank KI – Startup vereinfacht Klinikstudien: Pitchdeck hier

Inspohub

Honor 400 Pro im Test: Hervorragendes Smartphone mit Top-Kamera

Künstliche Intelligenz

Honor 400 Pro im Test: Hervorragendes Smartphone mit Top-Kamera

Design

Display

Kamera

Ausstattung

Software

Akku

Preis

Fazit

Künstliche Intelligenz

Ausgezeichnete VR-Spiele gratis ausprobieren: VR Forever Fest startet auf Steam

Spiel des Jahres wird ein Knet-Abenteuer

Empfohlener redaktioneller Inhalt

Empfohlener redaktioneller Inhalt

Unsere Empfehlung: Vier Demos zum Ausprobieren

Künstliche Intelligenz

Wie OpenAI erklärt, warum LLMs bei völliger Ahnungslosigkeit sicher auftreten

Die wichtigsten Erkenntnisse

Pre-Training: Datenqualität nicht allein ausschlaggebend

Post-Training: Ist gut geraten halb gewusst?

Das Problem der Benchmarks

OpenAIs Lösungsvorschlag: Confidence Targets

Fazit: Mit interessierter Vorsicht zu genießen

Künstliche Intelligenz

Agibot Lingxi X2: Humanoider Roboter schafft Webster-Flip

Körperbeherrschung

Empfohlener redaktioneller Inhalt

Ausgezeichnete VR-Spiele gratis ausprobieren: VR Forever Fest startet auf Steam

So produziert ihr einen KI-Podcast in 5 Minuten (fast) ohne Code

Instagram-Algorithmus selbst steuern – so geht’s

Der ultimative Guide für eine unvergessliche Customer Experience

Adobe Firefly Boards › PAGE online

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Beliebt

Inspohub

Honor 400 Pro im Test: Hervorragendes Smartphone mit Top-Kamera

Design

Display

Kamera

Ausstattung

Software

Akku

Preis

Fazit

Das könnte Ihnen gefallen

Künstliche Intelligenz

Ausgezeichnete VR-Spiele gratis ausprobieren: VR Forever Fest startet auf Steam

Spiel des Jahres wird ein Knet-Abenteuer

Empfohlener redaktioneller Inhalt

Empfohlener redaktioneller Inhalt

Unsere Empfehlung: Vier Demos zum Ausprobieren

Künstliche Intelligenz

Wie OpenAI erklärt, warum LLMs bei völliger Ahnungslosigkeit sicher auftreten

Die wichtigsten Erkenntnisse

Pre-Training: Datenqualität nicht allein ausschlaggebend

Post-Training: Ist gut geraten halb gewusst?

Das Problem der Benchmarks

OpenAIs Lösungsvorschlag: Confidence Targets

Fazit: Mit interessierter Vorsicht zu genießen

Künstliche Intelligenz

Agibot Lingxi X2: Humanoider Roboter schafft Webster-Flip

Körperbeherrschung

Empfohlener redaktioneller Inhalt

Ausgezeichnete VR-Spiele gratis ausprobieren: VR Forever Fest startet auf Steam

So produziert ihr einen KI-Podcast in 5 Minuten (fast) ohne Code

Instagram-Algorithmus selbst steuern – so geht’s

Der ultimative Guide für eine unvergessliche Customer Experience

Adobe Firefly Boards › PAGE online

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Beliebt