Künstliche Intelligenz
Konfrontation mit der Realität: Neuer KI-Benchmark OfficeQA
Mit OfficeQA stellt Databricks einen neuen Open-Source-Benchmark vor, der eine Lücke in der bisherigen Bewertung großer Sprachmodelle und KI-Agenten schließen soll. Anders als populäre Tests wie ARC-AGI-2, Humanity’s Last Exam oder GDPval zielt OfficeQA nicht auf abstrakte Denkaufgaben, sondern auf realitätsnahe Szenarien aus dem Unternehmensalltag – dort, wo Fehler teuer werden.
Weiterlesen nach der Anzeige
Im Fokus steht sogenanntes Grounded Reasoning: KI-Systeme müssen Fragen auf Basis großer, heterogener und teils unstrukturierter Dokumentbestände beantworten. Databricks greift dafür auf die U.S. Treasury Bulletins zurück – fast 89.000 Seiten mit Tabellen, Revisionen und historischen Daten von über acht Jahrzehnten. Der Benchmark umfasst 246 Fragen mit eindeutig prüfbaren Antworten, unterteilt in „leicht“ und „schwer“, je nachdem, wie gut aktuelle Frontier-Modelle abschneiden.

Anthropics Claude Opus 4.5 Agent löste 37,4 Prozent, während OpenAI’s GPT-5.1 Agent auf dem gesamten Datensatz 43,1 Prozent erreichte. Auf OfficeQA-Hard, einem Teilset mit 113 besonders schwierigen Beispielen, erzielte Claude Opus 4.5 Agent 21,1 Prozent und GPT-5.1 Agent 24,8 Prozent.
(Bild: Databricks)
Die Ergebnisse fallen niedrig aus. Ohne Zugriff auf den Dokumentenkorpus beantworten getestete Agenten – darunter ein GPT-5.1-Agent sowie ein Claude-Opus-4.5-Agent – nur rund zwei Prozent der Fragen korrekt. Selbst mit bereitgestellten PDFs liegt die Trefferquote unter 45 Prozent, bei besonders schwierigen Fragen sogar unter 25 Prozent. Die Ergebnisse legen nahe, dass starke Leistungen bei akademischen Benchmarks wenig über die Einsatzreife im Unternehmen aussagen.
„Fast richtig“ genügt in Unternehmen nicht
Die Analyse der Fehler offenbart bekannte, aber ungelöste Probleme: Parsing-Fehler bei komplexen Tabellen, unzureichender Umgang mit mehrfach überarbeiteten Finanzdaten und Defizite beim visuellen Verständnis von Diagrammen. Kritisch ist dabei weniger die Existenz dieser Schwächen als ihre Tragweite: In Unternehmenskontexten reicht „fast richtig“ nicht aus – falsche Kennzahlen oder veraltete Werte können gravierende Folgen haben.

Testfrage zur visuellen Interpretation: KI-Agenten scheitern daran, die Anzahl lokaler Maxima in den Liniendiagrammen auf Seite 5 des US Treasury Monthly Bulletin (September 1990) korrekt zu bestimmen.
(Bild: Databricks)
OfficeQA versteht sich damit weniger als Leistungsschau, sondern vielmehr als Diagnoseinstrument. Auffällig ist die konsequente Ausrichtung auf realitätsnahe Dokumente und eindeutig, automatisiert überprüfbare Antworten. Zugleich bleibt die Frage offen, wie repräsentativ ein einzelner – wenn auch umfangreicher – Datenkorpus für die Vielfalt unternehmensinterner Informationsquellen ist. Hier muss sich der neue Benchmark in weiteren Szenarien erst bewähren. Genau dafür ruft Databricks den Grounded Reasoning Cup 2026 ins Leben: Forscher und Industriepartner sollen OfficeQA über das Treasury-Beispiel hinaus erproben und so zu einer breiteren Akzeptanz und Weiterentwicklung des Ansatzes beitragen.
Weiterlesen nach der Anzeige
Der von Databricks entwickelte OfficeQA-Benchmark wird als Open-Source-Projekt frei für die Forschungsgemeinschaft bereitgestellt und ist über das öffentliche GitHub-Repository abrufbar.
(fo)
Künstliche Intelligenz
E-Scooter Ausom L1 im Test: großer Akku, gute Federung & Blinker für 499 Euro
Der Ausom L1 zeigt im Test viel Offroad-Tauglichkeit fürs Geld: Vollfederung, 749-Wh-Akku, Blinker und Straßenzulassung. Doch ein Punkt trübt den positiven Gesamteindruck.
Vollfederung, Riesenakku, Blinker und Straßenzulassung für unter 500 Euro? Das klingt fast zu gut, um wahr zu sein. Doch der Ausom L1 will genau das liefern. Der robuste Offroad-E-Scooter kombiniert einen 749 Wh großen Akku mit einem 930-W-Motor, einstellbarer Federung an beiden Rädern und StVO-konformen Blinkern. Hier ist dank Allgemeiner Betriebserlaubnis (ABE) alles legal.
Damit wildert der Ausom L1 im Revier etablierter Offroad-Modelle. Der Joyor Y8-S (Testbericht) kostet ähnlich wenig und bringt sogar mit 1248 Wh einen fast doppelt so großen Akku mit. Wer mehr investieren kann, greift zum Segway Ninebot Max G3 D (Testbericht) – geniale Federung, perfekte Verarbeitung und 2000 W Spitzenleistung sprechen für unseren Testsieger.
Aktuell kostet der Ausom L1 bei Amazon 499 Euro. Ob er trotz des günstigen Preises mit der Konkurrenz mithalten kann, zeigt unser Test.
Aufbau, Optik & Verarbeitung
Der Aufbau des Ausom L1 dauert rund 15 Minuten – etwas länger als bei den meisten Konkurrenten. Nach der Fixierung der Lenkerstange müssen Lenker, Display und Frontlicht separat angeschraubt werden. Im Karton liegen neben dem E-Scooter ein Netzteil, drei NFC-Karten, Montagehandschuhe und eine Bedienungsanleitung. Anschließend muss man den Reifendruck und die Bremsen prüfen. Wir empfehlen das Tragen eines Helms.
Optisch macht der Ausom L1 mehr her, als sein günstiger Preis vermuten lässt. Der massive Stahlrahmen in Grau mit gelb-orangen Akzenten wirkt erwachsen und robust. Das breite Trittbrett (51 × 19 cm) bietet ausreichend Standfläche. Am Heck schützt eine leicht erhöhte Ablage das Schutzblech und dient gleichzeitig als Stütze für den hinteren Fuß. 15 cm Bodenfreiheit sorgen dafür, dass auch höhere Bordsteinkanten oder Wurzeln kein Problem darstellen. Die großen Schutzbleche aus Kunststoff sitzen fest und halten Spritzwasser zuverlässig ab.
Die Verarbeitung überrascht für diese Preisklasse. Saubere Schweißnähte, ein steifes Lenkrohr, ein verwindungsarmer Rahmen – Billig-Plastikteile oder störende Spaltmaße sucht man vergeblich. Der E-Scooter sieht schlicht teurer aus, als er ist. Mit IP54-Zertifizierung trotzt er Spritzwasser aus beliebigem Winkel.
Mit 28 kg ist der Ausom L1 allerdings ein echtes Schwergewicht. Selbst der schwere Doppelmotor-Bolide Iscooter IX7 Pro (Testbericht) wiegt mit 30 kg nur wenig mehr. Wer den Ausom L1 regelmäßig in den dritten Stock ohne Aufzug schleppen muss, sollte vorher seinen Bizeps trainieren.
Der Klappmechanismus ist unnötig kompliziert. Statt eines einfachen Schnellverschlusshebels muss zunächst eine große Kunststoffschraube gelöst werden – das dauert etwa zehn Sekunden. Auch das Einhaken der Lenkstange am hinteren Trittbrett gelingt nicht intuitiv: Die Lenkstange muss erst auf die richtige Höhe gebracht werden, bevor der Haken greift. Das hätte man deutlich einfacher lösen können. Zusammengeklappt misst der E-Scooter etwa 125 × 69 × 56 cm. Für den täglichen Transport im ÖPNV oder häufiges Treppensteigen ist er damit weniger geeignet.
Lenker & Display
Der Lenker ist mit 69 cm erfreulich breit und vermittelt gute Kontrolle. Seine Höhe lässt sich zwischen 113 und 133 cm verstellen – damit eignet sich der E-Scooter für Fahrer von 150 bis 200 cm Körpergröße. Die ergonomisch geformten Griffe liegen angenehm in der Hand.
Etwas gewöhnungsbedürftig: Der Gashebel wird nicht mit dem Daumen, sondern mit dem Zeigefinger bedient. Er geht etwas straff. Bei längeren Fahrten kann das zu Ermüdung oder gar Schmerzen im Finger führen.
Das 4,5-Zoll-LC-Display ist eines der größten, die wir bisher an einem E-Scooter gesehen haben. Es zeigt Geschwindigkeit, Fahrmodus, Akkustand, Distanz und verschiedene Untermenüs übersichtlich an. Selbst bei direkter Sonneneinstrahlung bleibt es gut ablesbar.
Die integrierten Blinker an den Lenkerenden sind erfreulich hell. Ein Wippschalter auf der linken Seite aktiviert sie. Ein akustisches Signal gibt es nicht und der Blinker schaltet sich nicht automatisch ab – hier muss der Fahrer aufpassen.
Das Voll-LED-Lichtsystem überzeugt. Der im Abstrahlwinkel verstellbare Frontscheinwerfer leuchtet hell und hat einen seitlichen Lichtaustritt, der die Sichtbarkeit bei Nachtfahrten verbessert. Das Rücklicht leuchtet beim Bremsen zusätzlich auf. Einen Dämmerungssensor gibt es nicht, das Licht wird über einen separaten Schalter aktiviert.
Besonders ist das Sicherheitskonzept. Vor jeder Fahrt muss ein Passwort eingegeben (Standard: 0000) oder eine der drei beiliegenden NFC-Karten ans Display gehalten werden. Über ein verstecktes Untermenü – Plus- und Minus-Taste gleichzeitig gedrückt halten – lassen sich unter Position P23 neue Passwörter und unter P18 neue NFC-Karten binden. Sogar das eigene Smartphone funktioniert mit einer entsprechenden NFC-App als Schlüssel. Coole Option, aber alles andere als selbsterklärend. Ohne Bedienungsanleitung steht man hier auf dem Schlauch.
Eine eigene App gibt es leider nicht. Schade, denn sie hätte die Passwort- und NFC-Verwaltung deutlich komfortabler gemacht.
Fahren
Auf dem Ausom L1 stehen – das fühlt sich erst mal gut an. Das breite Trittbrett bietet viel Platz, die erhöhte Ablage am Heck gibt dem hinteren Fuß Halt. Dank des höhenverstellbaren Lenkers und der ergonomischen Griffe finden Fahrer unterschiedlicher Statur eine bequeme Position. Drei Fahrmodi stehen zur Wahl: Eco (ca. 10 km/h), Sport (ca. 15 km/h) und Race (ca. 20–22 km/h). Die Umschaltung erfolgt über die Plus- und Minus-Tasten an der rechten Seite des Lenkers.
Die Vollfederung mit einstellbaren Federn an Vorder- und Hinterrad ist das Herzstück des E-Scooters. Sie schluckt Schlaglöcher, Kopfsteinpflaster, Schotter und kleine Wurzeln hervorragend. Auf Feldwegen fühlt sich der Ausom L1 richtig wohl – hier spielt er seine Stärken voll aus. Die 10-Zoll-Tubeless-Offroad-Reifen bieten guten Grip auf Asphalt und leichten Waldwegen.
Allerdings – und das ist der größte Kritikpunkt am E-Scooter – fühlt sich das Fahren ungewöhnlich schwammig an. Präzise Lenkmanöver gelingen nur mit Mühe. Das liegt vermutlich an der weichen Federung. Dieses Problem kennen wir auch vom Trittbrett Fritz (Testbericht), dort ist es aber weniger ausgeprägt. Andere vollgefederte Modelle wie der Segway Ninebot Max G3 D oder der Navee S65D bekommen das deutlich besser hin. Wer ein knackiges, direktes Fahrgefühl erwartet, wird enttäuscht.
Der Heck-Nabenmotor mit 500 W Nennleistung (48-V-System) und bis zu 930 W Spitzenleistung zieht kräftig aus dem Stand an. 29 Nm Drehmoment sorgen dafür, dass auch leichte Steigungen souverän gemeistert werden. Im Race-Modus schöpft der Motor den gesetzlichen Rahmen mit 20 bis 22 km/h gut aus.
Das Bremssystem mit E-ABS und mechanischen Scheibenbremsen an Vorder- und Hinterrad packt satt zu. Der Bremsweg ist kurz, die Dosierung gelingt feinfühlig. Auch bei Vollbremsungen bleibt der E-Scooter kontrollierbar.
Akku
Der Lithium-Ionen-Akku hat eine Kapazität von 749 Wh (48 V / 15,6 Ah) und ist fest eingebaut. Laut Hersteller soll eine Reichweite von bis zu 70 km möglich sein – unter Idealbedingungen.
Im Praxistest mit einem 85 kg schweren Fahrer, Race-Modus, flacher Strecke und 15 °C Außentemperatur kommen wir auf 35 bis 45 km. Ein solider Wert, der für die meisten Pendelstrecken und Freizeitausflüge ausreicht. Die reale Reichweite hängt wie immer von Fahrergewicht, Temperatur, Streckenprofil und Fahrstil ab.
Die Ladezeit von 9 bis 10 Stunden mit dem mitgelieferten 54,6 V / 1,5-A-Ladegerät ist eine echte Geduldsprobe. Über Nacht laden – andere Optionen gibt es kaum.
Preis
Der Ausom L1 kostet aktuell 499 Euro bei Amazon. Für einen vollgefederten Offroad-E-Scooter mit 749 Wh Akku, Blinkern und Straßenzulassung ist das ein ausgesprochen fairer Preis. In dieser Ausstattungskombination gibt es aktuell kaum Konkurrenz zu diesem Kurs.
Fazit
Der Ausom L1 liefert für vergleichsweise wenig Geld eine beeindruckende Ausstattung. Der große 749-Wh-Akku sorgt für ordentliche Reichweite, die Vollfederung schluckt Feldwege und Schlaglöcher zuverlässig, die Blinker erhöhen die Sicherheit im Straßenverkehr. Auch schwerere Fahrer zieht der kräftige Motor souverän durch die Gegend. Die Bremsen packen verlässlich zu. Und die Verarbeitung überrascht positiv für diese Preisklasse – saubere Schweißnähte, steifer Rahmen, keine Billig-Anmutung.
Doch es gibt Schattenseiten. Das schwammige Fahrgefühl ist der größte Kritikpunkt. Andere vollgefederte E-Scooter fahren sich deutlich präziser. Der umständliche Klappmechanismus nervt, das Gewicht von 28 kg macht den Transport zur Kraftübung, und die Ladezeit von 9 bis 10 Stunden erfordert Geduld. Auch der straffe Zeigefinger-Gashebel ist ein Minuspunkt.
Wer einen günstigen Offroad-E-Scooter mit großem Akku und Straßenzulassung sucht und über das schwammige Fahrgefühl hinwegsehen kann, bekommt hier viel E-Scooter fürs Geld. Für den Preis gibt es schlicht keinen besser ausgestatteten Offroad-Roller mit ABE – man muss nur damit leben, dass er sich eher wie ein gemütlicher Feldweg-Cruiser als ein präzises Fahrinstrument anfühlt.
Künstliche Intelligenz
Menschliche Blähungen: Forscher messen deutlich mehr „Ereignisse“ als gedacht
Heiße Luft wird bekanntlich vielerorts produziert. Forscher der Universität Maryland haben jetzt aber buchstäblich Wind davon bekommen, dass dies deutlich häufiger der Fall ist als bislang angenommen. Im Schnitt gehen pro Tag 32 Blähungsereignisse vom Menschen aus. Bislang wurde angenommen, dass es 14-mal täglich Rückenwind gibt. Ermöglicht hat diese Erkenntnis ein Sensor, den die Forscher entwickelt haben. Dieser wird an der Unterwäsche befestigt und misst die Darmgase.
Weiterlesen nach der Anzeige

Das Internet ist voll von heißen IT-News und abgestandenem Pr0n. Dazwischen finden sich auch immer wieder Perlen, die zu schade sind für /dev/null.
Der Sensor detektiert hierzu Wasserstoffgas. Während manche beim Thema Blähungen zuerst an Methan denken, sind es in Wirklichkeit die Wasserstoffemissionen, die die Blähung verraten – egal ob als stille Post oder als lautes Darmgewitter. Wasserstoff entsteht, wenn Darmbakterien Kohlenhydrate fermentieren. Bisherige Studien stützten sich auf Patiententagebücher, Labortests oder kurze klinische Beobachtungen, wie die Originalstudie zeigt. Der Sensor zeigte hingegen auch an, ob nachts und in anderen Alltagssituationen die Luft rein ist.
Manche Menschen sind „Hyper-Produzenten“
Die Studie ist Teil eines größeren Forschungsprojekts namens „Human Flatus Atlas“. Es geht dabei darum, die normale Gasproduktion über verschiedene Personen, Ernährungsweisen und Mikrobiome hinweg zu kartieren.
Die Spanne der Auslassungen lag den Forschern zufolge zwischen vier und 59 „Ereignissen“ pro Tag. Die Probanden selbst waren keine verlässlichen Ansprechpartner – ihre Selbstauskünfte hätten sich im Vergleich zum Gassensor als hochgradig unzuverlässig erwiesen. Was die Forscher auch feststellten: Einige Menschen seien „Wasserstoff-Hyper-Produzenten“, andere produzieren hingegen trotz ballaststoffreicher Ernährung überraschend wenig Gas.
Weiterlesen nach der Anzeige
Doch allen Späßchen zum Trotz dienen Sensor und Forschung einem guten Zweck: Ziel ist es, ein besseres Verständnis von Magen-Darm-Erkrankungen wie Reizdarmsyndrom und Nahrungsmittelunverträglichkeiten zu gewinnen. Bei diesen ist übermäßige Gasproduktion ein Symptom. Diese war bislang aber schwer messbar.
(mki)
Künstliche Intelligenz
GeForce: Nvidias aktuelle Sicht auf Gamer
Die Eröffnungsrede vom Nvidia-Chef Jensen Huang zur Hausmesse GTC 2026 verdeutlicht, wie weit sich die Firma inzwischen von ihrem einstigen Kerngeschäft Gaming distanziert hat. Huang sagte zu Beginn der Präsentation (nach der Wartemusik ab Minute 46:00):
Weiterlesen nach der Anzeige
„Ich weiß, wie viele von euch mit GeForce aufgewachsen sind. GeForce ist Nvidias größte Marketingkampagne. Wir gewinnen zukünftige Kunden schon lange, bevor ihr es euch selbst leisten könnt. Eure Eltern haben dafür bezahlt, dass ihr Nvidia-Kunden werdet. Und jedes einzelne Jahr haben sie weiter dafür bezahlt. Jahr für Jahr für Jahr, bis ihr eines Tages zu hervorragenden Informatikern geworden seid und zu richtigen Kunden, zu richtigen Entwicklern. Das ist das Haus, das GeForce geschaffen hat.“
Nur jemand, der sich selbst eine Grafikkarte leisten kann, ist demnach ein „richtiger Kunde“. Der Fokus liegt offensichtlich auf Kunden, die mit einer Nvidia-GPU nicht spielen, sondern damit entwickeln.
„Ohne GeForce […] kein Heute“
Schon in einem kurzen Video zum 25. Jubiläum der GeForce 3 resümierte Huang: „Ohne GeForce gäbe es kein CUDA, ohne CUDA gäbe es keine KI, ohne KI gäbe es kein Heute.“ CUDA ist Nvidias Verbund aus GPU-Architektur und Programmierschnittstelle, auf den das eigene KI-Ökosystem ausgelegt ist. Token sieht Huang als umfassende Währung für Unternehmen, die Wachstum ermögliche.
Die stiefmütterliche Behandlung von Spielern zeichnete sich schon bei der Vorstellung der RTX-5000-Serie ab. Bis auf die GeForce RTX 5090 sind die Neulinge nur moderat schneller als die 4000er-Vorgängerinnen. Nvidia differenziert die verschiedenen Generationen zusätzlich über KI-Funktionen, etwa die RTX-5000-exklusive mehrfache Multi-Frame-Generation (MFG), also künstliche Bilder zwischen normal gerenderten.
Auf der GTC 2026 stellte Nvidia DLSS 5 mit Neural Rendering vor, das künstliche Intelligenz tiefer in ein Spiel verankert. Die gezeigten Spielszenen werden aber auch als KI-Slop kritisiert, weil Figuren einen KI-Look erhalten.
GeForce ist für Nvidia nur noch eine Nische
Weiterlesen nach der Anzeige
Aus wirtschaftlicher Sicht ist Nvidias Fokus auf KI derweil nachvollziehbar. Im letzten Quartal machte die Firma mit KI-Beschleunigern und Server-Hardware mehr als 62 Milliarden US-Dollar Umsatz. GeForce-Grafikkarten kamen nur auf sechs Prozent davon: 3,7 Milliarden US-Dollar. Die Schere dürfte dieses Jahr noch weiter auseinandergehen.
Mit dem neuen ARM-Prozessor Vera will Nvidia auch verstärkt reine CPU-Systeme für Rechenzentren verkaufen. Huang glaubt, dass CPUs zu einem Milliardengeschäft für Nvidia heranwachsen könnten. Auch sie würden dann potenziell GeForce-Grafikkarten überholen.
(mma)
-
Künstliche Intelligenzvor 3 MonatenSchnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt
-
Social Mediavor 2 WochenCommunity Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast
-
Social Mediavor 1 MonatCommunity Management zwischen Reichweite und Verantwortung
-
Künstliche Intelligenzvor 4 Wochen
Top 10: Die beste kabellose Überwachungskamera im Test – Akku, WLAN, LTE & Solar
-
Social Mediavor 3 MonatenDie meistgehörten Gastfolgen 2025 im Feed & Fudder Podcast – Social Media, Recruiting und Karriere-Insights
-
UX/UI & Webdesignvor 2 MonatenEindrucksvolle neue Identity für White Ribbon › PAGE online
-
Künstliche Intelligenzvor 2 MonatenAumovio: neue Displaykonzepte und Zentralrechner mit NXP‑Prozessor
-
Künstliche Intelligenzvor 3 MonatenÜber 220 m³ Fläche: Neuer Satellit von AST SpaceMobile ist noch größer
