Connect with us

Künstliche Intelligenz

Eine Woche Atlas-Browser: Ich bin jetzt dümmer


Ein Woche ChatGPT Atlas: Der Browser, der vieles besser machen will, macht am Ende das meiste schlechter als ein normaler Browser mit geöffnetem ChatGPT.com. c’t 3003 ist erschüttert.

Weiterlesen nach der Anzeige

(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)

Guckt mal hier, das ist ChatGPT Atlas, der erste Browser von OpenAI. OpenAI sagt, wir haben den Browser völlig neu erfunden. Nach einer Woche Atlas-Benutzung sage ich: ChatGPT Atlas ist nicht nur komplett unnütz, sondern auch gefährlich, also wirklich gefährlich. Und langsam ist er auch noch. Ich würde so weit gehen und sagen, ChatGPT Atlas ist ein Anti-Web-Browser, der das Netz schlechter macht. Bleibt dran.

Liebe Hackerinnen, liebe Internet-Surfer, herzlich willkommen hier bei…

Ja, so sieht er aus, der ChatGPT-Atlas-Browser. Ist echt clean und minimalistisch, das muss ich zugeben. Definitiv cleaner als Perplexity Comet, der andere KI-Browser, über den gerade viele Leute reden. Und offenbar stecken wir mitten in so etwas wie einem KI-Browser-Krieg. Also die großen Unternehmen, die scheinen doll darum zu kämpfen, Leute auf ihre Browser zu kriegen. Perplexity zahlt zurzeit acht Euro. Leute, acht Euro, wenn man jemanden findet, der oder die einfach nur Comet installiert und sich darin einloggt. Acht Euro! Acht Euro für einen User.

Ja, und natürlich sind auch Google und Microsoft intensivst dabei, ihre KI-Systeme hart mit ihren Browsern Chrome und Edge zu verdrahten und der Kundschaft das aufzudrücken. Aber dazu hatten wir schon ein Video. Hier soll es um ChatGPT Atlas gehen. Und das ist auch der Browser, der auf jeden Fall ein riesiges Potenzial hat, denn ChatGPT hat ja von allen generativen KI-Systemen mit Abstand den größten Marktanteil von über 80 Prozent. Also ChatGPT gehört für viele Leute, gerade für jüngere Leute, absolut zum Alltag dazu. 57 Prozent der 14- bis 29-Jährigen nutzen regelmäßig KI-Tools, meistens ChatGPT, und ich gehöre auch dazu. Ich benutze in vielen Fällen sehr gerne ChatGPT. Das würde ich vorab gerne einmal deutlich sagen. Nicht, dass ich hier so rüberkomme wie so ein totaler Hater.

Bin ich echt nicht, auch wenn ich einige Sachen durchaus negativ sehe. Aber so negativ wie ChatGPT Atlas habe ich bislang noch kein OpenAI-Produkt gesehen. Atlas ist eine Katastrophe für eure Privatsphäre, für eure Sicherheit, für das ganze Internet. Ich stell euch jetzt mal ganz kurz und sachlich vor, was Atlas kann. Und danach gibt es fünf Gründe, warum Atlas niemand braucht. Ach so, noch wichtig: Atlas gibt es im Moment nur für macOS-Versionen. Für Windows, Android und iOS sind aber angekündigt, eine Linux-Version gibt es nicht.

Weiterlesen nach der Anzeige

Also, wenn ihr Atlas startet, dann seht ihr das hier. Und ja, das sieht fast genauso aus wie einfach die ChatGPT-Startseite. Und tatsächlich verhält sich das auch so. Also, wenn ihr hier was eingebt, dann wird das so verarbeitet wie auf chatgpt.com. Allerdings, wenn ihr da zum Beispiel „Heise“ eingebt, dann kriegt ihr nicht nur Infos über Heise, sondern ihr könnt hier oben auch auf die Website draufklicken und dann, ja, seid ihr drauf auf der Website, wie Browser das eben so machen.

Das ChatGPT in Atlas hat zusätzlich auch Zugriff auf eure Browser-History. Ihr könnt also in Atlas sagen: Mach mir mal alle Seiten auf, auf denen ich in den letzten Tagen nach Bauchtaschen gesucht habe. Außerdem könnt ihr einige Einstellungen einfach per Prompt vornehmen, also so etwas wie: Schalte mal in den hellen Modus oder schalte mal in den dunklen Modus. Und ihr habt hier oben eine ChatGPT-Fragen-Schaltfläche und dann könnt ihr ChatGPT auf die Seite loslassen, auf der ihr gerade seid, und da was fragen zu der Seite, also: Fass mir das mal zusammen. Und wenn ihr ein Plus-Abo habt, also für 23 Euro im Monat, dann könnt ihr auch den Agentenmodus einschalten. Dann kann ChatGPT wirklich Sachen machen, also klicken auf der Seite. Und anders als bei dem Agentenmodus auf chatgpt.com arbeitet der Agent in Atlas wirklich in eurem Browser, also auf euren Seiten, in die ihr ja auch eingeloggt seid. Auf chatgpt.com arbeitet der Agent ja immer nur in dieser abgekapselten Sandbox. Das heißt, er hat keinen Zugriff auf euren Browser oder Computer.

Ja, und das war es auch schon. Ihr merkt wahrscheinlich, dass OpenAI nicht wirklich was neu erfunden hat. Bisschen lustig auch, dass die im Ankündigungsvideo gesagt haben, wir wollen unbedingt sichergehen, dass sich Atlas nicht anfühlt wie dein alter Browser mit einem angetackerten Chat-Button. Aber genau so fühlt sich Atlas an. Und die Kommentare unter dem Ankündigungsvideo machen sich auch die ganze Zeit darüber lustig. Sehr schön zum Beispiel: Minute 7:45, Sam Altman fällt auf, dass sein Team einfach einen Chrome mit ChatGPT als Startseite gemacht hat. Ja, und genau das stimmt auch tatsächlich, auch wenn OpenAI sich doll Mühe gibt, das zu verstecken. Atlas ist einfach ein modifiziertes Chromium und Chromium ist ja einfach die Open-Source-Variante von Chrome. Also das kann sich jeder nehmen, modifizieren und als neuen Browser verteilen.

Ja, und da hätten wir direkt Grund Nummer eins, warum Atlas niemand braucht. Er ist total langsam und zwar erst mal vom technischen Fundament her. Wenn man den Speedometer-3.1-Benchmark ausführt, der so konzipiert ist, dass er möglichst die empfundene Geschwindigkeit abbildet, dann kommt daraus: Ja, da ist der echte Chrome fast 50 Prozent schneller als Atlas. Alle Browser, die ich getestet habe, sind schneller als Atlas. Auch der große Perplexity-Konkurrent Comet, der übrigens auch ein Chromium ist, aber auch einfach bei der Reaktionsgeschwindigkeit der ChatGPT-Suche. Also wenn man da was eingibt. Also wenn ich hier jetzt nach c’t 3003 suche, dann dauert das viele, viele Sekunden, bis das zu Ende geladen hat. Wenn ich das in Google eingebe, instantan, also in weniger als einer Sekunde, habe ich das Resultat. Und man weiß ja, wie stark das ganze Netz auf Geschwindigkeit optimiert ist. Also wie viel Arbeit sowohl die Browser-Anbieter als auch die Website-Anbieter in jede gesparte Millisekunde stecken. Und jetzt kommt OpenAI und knallt uns hier so etwas vor den Latz. Joa, ist doch egal, dauert ein bisschen länger. Dafür ist es halt künstliche Intelligenz, Leute. Ist doch okay, dass man da ein bisschen aufwartet.

Ja, und dann kommen wir gleich zu Grund Nummer zwei. Das ist nicht das Internet, das ist ausgedachtes Internet. Wenn man im Internet sucht, da will man ja sehr oft real existierende Internetseiten finden. ChatGPT Atlas versucht – Betonung auf versucht – uns immer nur Antworten statt Websites zu geben. Das macht Google zwar inzwischen auch oft in diesem kleinen Kasten da oben, aber trotzdem bestehen immer noch große Teile der Google-Antwortseite aus echten Website-Links. Bei Atlas gibt es nur diesen mini kleinen Streifen, der echte Website-Suchtreffer anzeigt. Der Rest ist generiert, also selbst ausgedacht. Und in meinem Fall hier ist das absolut nicht das, was ich gesucht habe. Wenn ich c’t 3003 eingebe: Nein, ich meine nicht den „Ram Trailer Coupler“ oder was auch immer ChatGPT denkt, was c’t 3003 ist. Und ja, das ist gefährlich. Also nicht nur für mich als Journalist und meinen Arbeitgeber, der ja auf seiner eigenen Website Werbung verkauft, wo dann die Leute nicht mehr hinkommen, wenn sie ChatGPT Atlas benutzen, sondern das ist auch gefährlich für die Wahrheit, denn KI-Systeme halluzinieren. Das wissen wir ja inzwischen alle.

Grund Nummer drei: Meine Browser-History geht OpenAI nichts an. Guck mal, wenn ich hier eingebe: Sag mir mal alle meine gesundheitlichen Probleme der letzten Zeit. Also, guck in meine Browser-History. Ja, dann kommen da Erektile Dysfunktion, Salmonellenvergiftung und Durchfall. Ja, alles drei nicht wahr. Also wirklich, wirklich nicht wahr. Ich habe einfach extra auf ein paar Seiten geklickt. Und will man das, dass OpenAI diese Daten hat von einem? Also ich finde nicht. Das Ding ist ja auch, gibt ja diese theoretische Kosten-Nutzen-Rechnung: Ich gebe ein bisschen Privatsphäre auf und kriege dafür aber mehr Komfort. Nur der Komfort, also dass ChatGPT meine Browser-History durchforsten kann, der rechtfertigt also für mich absolut nicht den Privatsphäre-Verlust. Denn auch hier in Firefox kann ich ganz easy meine Browser-History aufrufen und die nach Stichworten durchforsten. Und wenn ich zum Beispiel alle Bauchtaschen-Shop-Websites aufmachen will, dann kann ich auch einfach „Bauchtasche“ eingeben und dann alle in Tabs öffnen. Das geht oft sogar schneller, als auf ChatGPT zu warten.

Ach so, übrigens, man kann den Zugriff auf die Browser-History in ChatGPT Atlas abschalten, was ich auf jeden Fall auch empfehlen würde, wenn man denn überhaupt ChatGPT Atlas benutzen muss.

Grund Nummer vier: Der Agent läuft schlechter als in der OpenAI-Sandbox. Ja, das ist wohl das größte Argument für Atlas. Man kann die KI im eigenen Browserfenster arbeiten lassen. Das Ding ist nur, die KI-Agenten stolpern zurzeit noch über Websites wie Grundschüler, die gerade erst lesen gelernt haben und auch die Maus noch nicht richtig bedienen können. Also das ist alles noch sehr wenig hilfreich. Als ich zum Beispiel den Agent darum gebeten habe, auf heise.de alle c’t-3003-Artikel zu suchen und dann eine nach Anzahl der Kommentare sortierte Liste anzulegen, das hat erstmal ewig gedauert und da kam auch eine total unvollständige Liste raus, also hier mit irgendwie 100 Einträgen, obwohl es über 300 c’t-3003-Videos gibt. Aber sogar die Sortierung war falsch. Also ChatGPT kann nicht mal zählen. Da kommt dann erst 19, dann 351 Kommentare, dann 21. Hm? Oder auch sehr schön: Bitte mach mir eine Liste mit allen c’t-3003-Produkten und bestelle alle. Als Mensch sucht man einfach c’t-3003-Produkte, sieht c’t-3003-Merch im Heise-Shop und sieht: Aha, gibt nur ein Produkt, alles klar, kann man bestellen oder auch nicht. ChatGPT dagegen rödelt acht Minuten rum, also acht Minuten, was für mich als Mensch fünf Sekunden dauert.

So, aber das Kurioseste ist, wenn ich den ChatGPT-Agent auf chatgpt.com in meinem normalen Browser benutze, also wo der Agent auf OpenAI-Servern in der Sandbox läuft, ohne Zugriff auf meinen echten Browser, dann dauert das nur halb so lange. Das ist zwar immer noch lahm, aber immerhin schneller und deutlich besser für die Sicherheit.

Das ist nämlich Grund Nummer fünf: Atlas ist unsicher. Es kommen zurzeit jeden Tag irgendwelche neuen Berichte über Sicherheitslücken in ChatGPT Atlas raus. Einige sind komplex, einige sind aber auch trivial, weil nämlich aktuelle KI-Systeme alle das Problem haben, dass sie oft nicht unterscheiden können, was der User-Prompt ist und was von außen kommt, also was aus dem Internet kommt. Das heißt, wenn ihr irgendwo im Netz unterwegs seid und sagt: Fass mir die Seite mal zusammen, und da dann auf der Website irgendwie ein Befehl an ChatGPT versteckt ist, ja, dann kann das sein, dass der Browser alles andere vergisst und nur diesen Befehl ausführt und irgendwelche blöden Sachen macht, die ihr nicht wollt. Das nennt sich Prompt Injection oder Indirect Prompt Injection und ist schon lange ein Problem. Diese Prompts können zum Beispiel auch in Bildern versteckt sein.

Hier mal ein Beispiel, das ich selbst nachvollzogen habe in Perplexity Comet. Da bin ich hier in einem Google Doc, wo ich einen Befehl für das KI-System reingeschrieben habe. So von wegen: „Vergiss alles andere, mach nur das und das.“ Und das hat er gemacht. Hier habe ich auch noch mal eine manipulierte falsche URL ausprobiert. Und das hat auch leider funktioniert. Also Comet ist einfach auf heise.de gegangen. Ich hätte da auch eine beliebige andere URL eingeben können. Und ich habe jetzt in Atlas auf die Schnelle selbst keine Prompt Injection nachvollziehen können, weil OpenAI das immer sehr schnell fixt, sobald wieder neue Lücken veröffentlicht sind. Das ist schön und gut, dass OpenAI das macht, aber es gibt halt ständig neue Lücken. Also da würde ich mich im Moment nicht drauf verlassen. Auch wenn es ziemlich cool ist, dass Atlas wirklich sagt: Aha, ich glaube, du willst mir gerade eine Prompt Injection unterschieben. Das habe ich natürlich gemerkt. Man hat erst mal das Gefühl, funktioniert alles. Aber wie gesagt, es kommen jeden Tag neue.

Das große Problem dahinter ist vor allem: Je mehr Rechte das Sprachmodell hat, also die KI, desto gefährlicher. Wenn ihr chatgpt.com einfach nur in einem Browserfenster verwendet, dann hat ChatGPT eben nur so viel Rechte wie eine Website. Wenn aber ChatGPT den ganzen Browser steuern kann wie bei Atlas, dann ist das deutlich gefährlicher. Also alleine, weil es ja zum Beispiel Zugriff auf meine Browser-History hat, ist also total denkbar, dass über so eine Prompt Injection eine böse Website meine ganze Browser-History abgreift mit meinen ganzen Krankheiten, habe ich euch ja gerade gezeigt.

Ja, und das ist halt das Ding: Wenn Atlas jetzt tolle Sachen für mich machen könnte, dann könnte man ja zumindest darüber diskutieren, dass man bereit ist, ein gewisses Risiko einzugehen dafür, dass man halt mehr Komfort, irgendwelche tollen Sachen bekommt. Aber ich habe wirklich buchstäblich nichts gefunden, was Atlas besser kann als, sagen wir mal, chatgpt.com in einem Firefox. Dafür kriegt man bei Atlas langsamere Geschwindigkeit, Datendiebstahlrisiken und ganz allgemein schlechtere Usability und einen langsameren Agent. Für mich ist die Sache klar: ChatGPT Atlas bringt nur OpenAI was, aber nicht den Usern. Isso. Tschüss.

c’t 3003 ist der YouTube-Channel von c’t. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen, Lukas Rumpler, Sahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.


(jkj)



Source link

Künstliche Intelligenz

ICANN nimmt 2026 wieder Anträge für neue generische Top-Level-Domains entgegen


Die ICANN hat die nächste Runde für Anträge auf neue generische Top-Level-Domains (gTLD) angekündigt. Die Vergabestelle für einmalige Namen und Adressen im Internet wird ab Ende April entsprechende Vorschläge für Domain-Endungen wie .bochum oder .cpu annehmen, die bislang nicht registriert wurden. Finanzkräftige Antragsteller werden allerdings bevorzugt, denn die ICANN (Internet Corporation for Assigned Names and Numbers) erhebt Gebühren von bis zu 227.000 US-Dollar für jeden akzeptierten Antrag. Zudem kann es in Streitfällen um bestimmte gTLD zu Auktionen kommen.

Weiterlesen nach der Anzeige

Zuletzt wurden Anträge auf gTLD im Frühjahr 2012 angenommen, was Bewerber damals 185.000 Dollar gekostet hat. Trotzdem zählte die ICANN vor mehr als dreizehneinhalb Jahren fast 2000 Anträge für neue Top-Level-Domains. Insbesondere Städtenamen waren beliebt als gTLD. Über ein Jahr nach der Antragstellung gingen .berlin und .wien als erste Städte-Domains online. Mittlerweile sind .hamburg, .amsterdam und .stockholm hinzugekommen, aber auch gTLD wie .bank, .edeka, .game und .microsoft.

Auf diese Anwendungsfälle verweist die ICANN jetzt zur neuen Runde im gTLD-Programm, denn sie können als Beispiele für neue Internetadressen dienen. Zudem stellt die Organisation einen Leitfaden für Bewerber bereit. Auf 440 Seiten werden so gut wie alle Details zu dieser gTLD-Antragsrunde dargelegt, bislang aber lediglich per PDF und nur auf Englisch. Eine HTML-Version soll im Januar 2026 folgen. Bis Ende Februar soll der Leitfaden auch in Arabisch, Chinesisch, Französisch, Russisch und Spanisch zur Verfügung stehen. Eine Liste aller bislang registrierten 1438 Top-Level-Domains stellt die IANA (Internet Assigned Numbers Authority) in Textform bereit:

„Es ist von Bedeutung, dass Antragsteller für neue gTLDs auf die Bewertung der von ihnen beantragten gTLD-Zeichenfolge sowie auf alle anderen erforderlichen Bewertungen, einschließlich der finanziellen und operativen Fähigkeiten, vorbereitet sind“, erklärt Kurtis Lindqvist, Präsident und CEO der ICANN in der Mitteilung der Organisation. „Der Leitfaden für Bewerber informiert sie genau über die Anforderungen und unterstützt sie bei der Durchführung des Verfahrens.“

Zu den Erfordernissen zählt auch ein recht hohes Budget der Antragsteller, denn allein die gTLD-Bewertungsgebühr beträgt schon 227.000 Dollar pro Antrag. Allerdings kann diese Gebühr bei sogenannten qualifizierten Bewerbern wie gemeinnützigen oder internationalen Organisationen, indigenen Gruppen oder Kleinunternehmen aus weniger entwickelten Volkswirtschaften, die finanzielle Unterstützung benötigen, um 75 bis 85 Prozent reduziert werden. Damit fallen dann nur noch 34.500 bis 56.750 Dollar pro gTLD-Antrag an.

Weiterlesen nach der Anzeige

Lesen Sie auch

Die ICANN eröffnet ihr Verfahren für neue gTLD-Anträge am 30. April 2026. Hoffentlich läuft es besser als bei der ersten Runde 2012. Zunächst machte das Bewerbungssystem für neue Domains schlapp, sodass das Antragsverfahren für neue Top-Level-Domains vorzeitig abgebrochen wurde. Die Internetverwaltung begründete ihren Schritt mit einem Softwareproblem, das nach Berichten über „ungewöhnliches Verhalten“ des Systems entdeckt worden sei. Beim nächsten Versuch nur einen Monat später gab es ein Datenschutzproblem, wodurch das gTLD-Bewerbungssytem kurzzeitig offline genommen wurde. Denn das System gab Informationen von Bewerbern preis, die nicht für die Veröffentlichung gedacht waren.


(fds)



Source link

Weiterlesen

Künstliche Intelligenz

Full-HD-Beamer Etoe Whale Pro im Test: Android TV, solides Bild, guter Klang


Der Etoe Whale Pro kostet 349 Euro. Er bringt Android TV 11, guten Klang und ein ordentliches Bild. Bei der Helligkeit schummelt der Hersteller allerdings.

Der Etoe Whale Pro für 349 Euro (Gutscheincode HeiseEtoe; gültig bis 22.01.26) ist das Nachfolgemodell des Etoe Seal Pro (Testbericht). Die Helligkeit soll von 1000 auf 1500 Ansi-Lumen gestiegen sein. Dazu kommt Android TV 11 mit nativer Netflix-Unterstützung. Wir haben uns den Etoe Whale Pro im Test genau angeschaut.

Design: Wie ist die Verarbeitung?

Der Etoe Whale Pro zeigt sich als kubischer Block in Anthrazit-Schwarz. Eine dezente rote Linie verläuft am unteren Gehäuserand. Der Look ist modern und passt ins Wohnzimmer.

An der Front dominiert die große Linse. Viele Lüftungsschlitze drumherum verraten: Hier wird ordentlich gekühlt. Die Abmessungen von 28 × 20 × 15 Zentimetern und das Gewicht von 3,7 Kilogramm machen den Beamer zum Stubenhocker. Zwei Hände zum Tragen sind Pflicht.

Das Plastikgehäuse fühlt sich robust und hochwertig an. Die Oberfläche ist wenig empfänglich für Fingerabdrücke. Abgerundete Kanten, keine scharfen Stellen, keine Verarbeitungsmängel. Die optische Einheit ist versiegelt und damit staubgeschützt.

Im Karton liegen neben dem Beamer eine Bluetooth-Fernbedienung, ein 180-Watt-Netzteil und eine mehrsprachige Anleitung.

Ausstattung: Was kann die Hardware?

Der Etoe Whale Pro löst nativ mit 1920 × 1080 Pixeln auf. Er dekodiert 4K-Inhalte und unterstützt HDR10. Das Kontrastverhältnis liegt bei etwa 3000:1. Die Projektionsgröße reicht bis 200 Zoll, wir empfehlen allerdings maximal 120 Zoll. Bei 2,7 Metern Abstand ergibt sich ein Bild mit etwa 100 Zoll Diagonale. Das Projektionsverhältnis liegt bei 1,22:1, der Mindestabstand zur Wand beträgt 1,2 Meter.

Als Anschlüsse gibt es einen HDMI-2.1-Port, USB und einen AUX-Ausgang. Drahtlos verbindet sich der Beamer über Dual-Band-WLAN mit 2,4 und 5 GHz sowie Bluetooth. Chromecast und Airplay sind integriert.

Als Prozessor arbeitet ein Amlogic S905. Im Betrieb zieht der Beamer etwa 130 Watt aus der Steckdose. MEMC-Technologie glättet Bewegungen bei Sport und Action. Einen integrierten Akku gibt es nicht.

Etoe Whale Pro

Bildqualität: Wie gut und hell ist die Darstellung?

Etoe gibt die Helligkeit mit 1500 Ansi-Lumen an. Im Test erreicht der Whale Pro diesen Wert nicht. Der Beamer ist deutlich dunkler. Die übertriebene Angabe wirkt wenig vertrauenswürdig.

In abgedunkelten Räumen liefert der Etoe Whale Pro dennoch ein gutes Bild. Die Full-HD-Auflösung sorgt für ausreichende Schärfe. Die Farben wirken natürlich und intensiv. Der Kontrast überzeugt für einen LCD-Beamer in dieser Preisklasse. Die Schwarztöne sind besser als bei vielen LCD-Konkurrenten.

Der Autofokus arbeitet zuverlässig. Auch die automatische Trapezkorrektur justiert das Bild aus verschiedenen Winkeln korrekt. Die Bildmitte ist scharf, zu den Rändern zeigt sich eine leichte Weichheit. Typisch für LCD-Projektoren.

HDR10 bringt mehr Details in hellen und dunklen Bildbereichen. Bei Umgebungslicht fällt die Bildqualität jedoch stark ab. Der Whale Pro ist ein Beamer für das abgedunkelte Heimkino. Wer auch bei Tageslicht projizieren will, benötigt mehr Lumen.

Etoe Whale Pro

Bedienung: Wie gut ist die Software?

Auf dem Etoe Whale Pro läuft Android TV 11. Netflix, Prime Video, Disney+ und Youtube sind nativ verfügbar. Das ist ein großer Vorteil.

Sideloading von Apps funktioniert problemlos. Allerdings ist das Betriebssystem veraltet: Das letzte Sicherheits-Update datiert vom 5. Februar 2024 und kann ein potenzielles Sicherheitsrisiko darstellen. Im Alltag läuft Android TV dennoch rund, damit gehört der Beamer insgesamt zum Besten, was in dieser Preisklasse zu haben ist.

Google Assistant ermöglicht Sprachsteuerung über die Bluetooth-Fernbedienung. Die Menüführung ist selbsterklärend. Die Navigation läuft nicht immer flüssig, dafür ist der Prozessor zu schwach.

Am Gerät befinden sich die wichtigsten physischen Tasten für Ein/Aus und Menüzugriff. Die Fernbedienung ist für den Alltag trotzdem unverzichtbar.

Etoe Whale Pro

Sound: Wie gut ist der Klang und wie laut ist der Lüfter?

Der Etoe Whale Pro hat zwei Lautsprecher mit je 10 Watt. Dolby Audio ist an Bord. Vier Klangmodi stehen zur Auswahl: Film, Musik, Standard und ein anpassbarer Modus. Der Klang mit präsentem Bass ist für integrierte Lautsprecher überdurchschnittlich kräftig. Damit ist er besser als viele Konkurrenten in der Preisklasse. Für echtes Heimkino-Gefühl empfehlen wir dennoch externe Lautsprecher über Bluetooth oder AUX.

Der Lüfter des Beamers ist vergleichsweise leise für diese Preisklasse und stört nur selten.

Preis: Wie teuer ist der Beamer?

Der Etoe Whale Pro kostet 349 Euro (mit Gutscheincode HeiseEtoe in Höhe von 20 Euro, gültig bis 22.01.26) statt 369 Euro. Die UVP liegt bei 439 Euro.

Fazit

Der Etoe Whale Pro bietet ein solides Gesamtpaket. Sein größter Trumpf: Android TV 11 mit nativer Netflix-Unterstützung. Die Verarbeitung ist für den Preis gut. Das kubische Design mit roten Akzenten wirkt elegant.

In abgedunkelten Räumen liefert der Beamer ein scharfes und farbintensives Full-HD-Bild. Autofokus und automatische Trapezkorrektur funktionieren zuverlässig. Die versiegelte optische Engine schützt vor Staub. Die 20-Watt-Lautsprecher mit Dolby Audio klingen besser als bei vielen Konkurrenten, dabei bleibt die Lautstärke des Lüfters im Rahmen.

Ärgerlich ist die übertriebene Helligkeitsangabe. Die angegebenen 1500 Ansi-Lumen erreicht der Whale Pro nicht. Für helle Räume ist der Beamer damit ungeeignet. Auch das letzte Sicherheits-Update vom Februar 2024 ist viel zu alt.

Trotzdem: Wer einen günstigen Heimkino-Beamer für abgedunkelte Räume sucht und Wert auf einfaches Streaming legt, findet im Etoe Whale Pro eine gute Option.



Source link

Weiterlesen

Künstliche Intelligenz

Konfrontation mit der Realität: Neuer KI-Benchmark OfficeQA


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Mit OfficeQA stellt Databricks einen neuen Open-Source-Benchmark vor, der eine Lücke in der bisherigen Bewertung großer Sprachmodelle und KI-Agenten schließen soll. Anders als populäre Tests wie ARC-AGI-2, Humanity’s Last Exam oder GDPval zielt OfficeQA nicht auf abstrakte Denkaufgaben, sondern auf realitätsnahe Szenarien aus dem Unternehmensalltag – dort, wo Fehler teuer werden.

Weiterlesen nach der Anzeige

Im Fokus steht sogenanntes Grounded Reasoning: KI-Systeme müssen Fragen auf Basis großer, heterogener und teils unstrukturierter Dokumentbestände beantworten. Databricks greift dafür auf die U.S. Treasury Bulletins zurück – fast 89.000 Seiten mit Tabellen, Revisionen und historischen Daten von über acht Jahrzehnten. Der Benchmark umfasst 246 Fragen mit eindeutig prüfbaren Antworten, unterteilt in „leicht“ und „schwer“, je nachdem, wie gut aktuelle Frontier-Modelle abschneiden.


Diagramm OfficeQA

Diagramm OfficeQA

Anthropics Claude Opus 4.5 Agent löste 37,4 Prozent, während OpenAI’s GPT-5.1 Agent auf dem gesamten Datensatz 43,1 Prozent erreichte. Auf OfficeQA-Hard, einem Teilset mit 113 besonders schwierigen Beispielen, erzielte Claude Opus 4.5 Agent 21,1 Prozent und GPT-5.1 Agent 24,8 Prozent.

(Bild: Databricks)

Die Ergebnisse fallen niedrig aus. Ohne Zugriff auf den Dokumentenkorpus beantworten getestete Agenten – darunter ein GPT-5.1-Agent sowie ein Claude-Opus-4.5-Agent – nur rund zwei Prozent der Fragen korrekt. Selbst mit bereitgestellten PDFs liegt die Trefferquote unter 45 Prozent, bei besonders schwierigen Fragen sogar unter 25 Prozent. Die Ergebnisse legen nahe, dass starke Leistungen bei akademischen Benchmarks wenig über die Einsatzreife im Unternehmen aussagen.

Die Analyse der Fehler offenbart bekannte, aber ungelöste Probleme: Parsing-Fehler bei komplexen Tabellen, unzureichender Umgang mit mehrfach überarbeiteten Finanzdaten und Defizite beim visuellen Verständnis von Diagrammen. Kritisch ist dabei weniger die Existenz dieser Schwächen als ihre Tragweite: In Unternehmenskontexten reicht „fast richtig“ nicht aus – falsche Kennzahlen oder veraltete Werte können gravierende Folgen haben.


Statistik U.S. Gross Saving Ratio, 1898-1990

Statistik U.S. Gross Saving Ratio, 1898-1990

Testfrage zur visuellen Interpretation: KI-Agenten scheitern daran, die Anzahl lokaler Maxima in den Liniendiagrammen auf Seite 5 des US Treasury Monthly Bulletin (September 1990) korrekt zu bestimmen.

(Bild: Databricks)

OfficeQA versteht sich damit weniger als Leistungsschau, sondern vielmehr als Diagnoseinstrument. Auffällig ist die konsequente Ausrichtung auf realitätsnahe Dokumente und eindeutig, automatisiert überprüfbare Antworten. Zugleich bleibt die Frage offen, wie repräsentativ ein einzelner – wenn auch umfangreicher – Datenkorpus für die Vielfalt unternehmensinterner Informationsquellen ist. Hier muss sich der neue Benchmark in weiteren Szenarien erst bewähren. Genau dafür ruft Databricks den Grounded Reasoning Cup 2026 ins Leben: Forscher und Industriepartner sollen OfficeQA über das Treasury-Beispiel hinaus erproben und so zu einer breiteren Akzeptanz und Weiterentwicklung des Ansatzes beitragen.

Weiterlesen nach der Anzeige

Der von Databricks entwickelte OfficeQA-Benchmark wird als Open-Source-Projekt frei für die Forschungsgemeinschaft bereitgestellt und ist über das öffentliche GitHub-Repository abrufbar.


(fo)



Source link

Weiterlesen

Beliebt