Künstliche Intelligenz

Durchaus beeindruckend: ChatGPT Agent im Test

KI-Agenten hypen zurzeit – kein Wunder, schließlich simulieren sie das Handeln echter Menschen. ChatGPT Agent, wohl das bislang meist beachtete Agenten-Produkt, erschien Mitte Juli. c’t 3003 hat die Software ausführlich getestet.

Transkript des Videos

(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)

Guck mal hier, ich tippe hier ein: Ey, ich brauche Merch für unseren YouTube-Kanal. Hier hast du unser Logo. Hol mal Preise ein für 500 T-Shirts. Gerne so Fairtrade und Bio-Baumwolle und so. Und wenn ich das bestätigt habe, einfach direkt zum Verlag in die Karl-Wiechert-Allee 10 in Hannover bestellen.

Ja, das ist krass, denn das macht der dann wirklich, der ChatGPT Agent. Okay, der hat natürlich keinen Zugriff auf meine Konten. Das heißt, er kann nicht selbst bezahlen, aber die ganze Vorrecherche hat er übernommen und auch den Großteil des Bestellprozesses. Ich muss dann hier nur noch meine Bezahldaten angeben und kann selbst auf „Bestellen“ klicken.

Ist das hier schon wieder die große KI-Revolution, die alles verändern wird? Nein, so einfach ist das nicht, denn Agents und vor allem der ChatGPT Agent, die haben aktuell noch große Probleme.

Das hier ist zum Beispiel der Ballermann-Hit „Serverparty in Palma“, den der Agent für mich geschrieben hat.

In diesem Video zeige ich euch, was schon geht – und das ist auch wirklich beeindruckend –, was noch nicht geht und wo auch unklar ist, ob es jemals gehen wird. Bleibt dran.

Liebe Hackerinnen, liebe Internet-Surfer, herzlich willkommen hier bei …

Was ist überhaupt ein KI-Agent?

Ja, also ChatGPT Agent. Aber lass uns erst mal definieren, was überhaupt so ein Agent ist. Denn der Begriff ist ja, sag ich mal, ziemlich unkonkret. Aber man hört zurzeit immer häufiger davon. Gerade neulich bei der Meldung, dass der Softbank-Manager Masayoshi Son gesagt hat, seine Firma werde Billionen von KI-Agenten einstellen, um echte Menschen rauswerfen zu können. Und Softbank ist laut Forbes immerhin die 130. größte Firma der Welt.

Ja, aber Agenten – ja, was ist das? Also man kann erst mal sagen, dass KI-Agenten Software sind, die mit vorhandenen großen Sprachmodellen arbeiten. Also z. B. der ChatGPT Agent mit GPT-4o. GPT-4o ist einfach das, was voreingestellt ist, wenn ihr ganz normal ChatGPT verwendet.

Und ihr kennt das ja wahrscheinlich, dass sich ChatGPT oder auch Claude oder Grok oder DeepSeek oder LLaMA sich weigern, Dinge wirklich durchzuziehen, also konkrete Dinge zu tun, z. B. irgendwie eine direkte, ausführbare Datei von eurem Programmierprojekt zu erstellen. Die sagen dann immer nur: „Ich kann dir Tipps geben, wie du das hinbekommst.“ Aber das war’s dann halt auch.

Mit Agenten ist das nun anders. Die sollen nämlich einmal die Autonomie von LLMs steigern – also dass die Sachen selbstständig machen und entscheiden können –, aber auch die Fähigkeiten ganz konkret verbessern.

Und wenn ihr jetzt sagt: „Ja, wieso, ChatGPT kann aber doch jetzt schon Python-Code ausführen oder auch Bildgenerierung anschmeißen, wenn ChatGPT das für sinnvoll hält?“ Ja, das stimmt. Das ist auch tatsächlich schon agentenähnliches Verhalten – also dass ChatGPT sich selbst überlegt, was es für Tools verwenden kann. Aber ein richtiger Agent ist nochmal autonomer unterwegs, und vor allem geht das dann auch über mehrere Schritte.

Also, wenn ich zu einem KI-Agenten sage: „Plan mir mal meinen Urlaub, dann und dann, da und da“, dann fängt der an zu überlegen: Wie kommt man denn da jetzt überhaupt hin? Muss ich da irgendwie einen Flug buchen oder einen Zug, Hotels buchen und so weiter? Und Stichwort „buchen“ – der bucht das dann auch wirklich. Zumindest Stand heute: anfangen, die Websites aufzurufen und da meine Daten einzutragen.

Wenn ich im normalen ChatGPT sage: „Plan mir mal meinen Urlaub“, dann gibt er mir halt einfach nur so eine Tagesablaufliste raus, was ich so machen kann. Ums Buchen muss ich mich dann selbst kümmern.

Zusammengefasst: Ein KI-Agent – und in dem Fall ganz konkret ChatGPT Agent – versucht, sich wie ein Mensch zu verhalten. Also eine Person, die mitdenkt und versucht, Entscheidungen in meinem Sinne selbst zu treffen.

Die etwas technischere Erklärung

Also, das war jetzt die nicht-technische Erklärung. Ich als Nerd finde das oft ein bisschen anschaulicher, wenn man das nochmal technisch erklärt. Der ChatGPT Agent hat Zugriff auf seinen eigenen Linux-Rechner. Also, ist natürlich ein virtueller Rechner, klar, aber darauf kann er halt Dinge tun. Also zum Beispiel ein Terminal oder einen Browser ausführen oder einfach ein Bildanzeige-Programm. Er kann dann einfach direkt mit Dateien arbeiten, die ich ihm schicke, oder er kann Dateien generieren, die er mir schickt.

Aber vor allem der Browser macht das Ding natürlich supermächtig, weil ja sehr vieles in einem Browser gemacht werden kann – zum Beispiel T-Shirts bestellen, also ein Beispiel vom Anfang.

Praxisbeispiel 1: Coding

Ja, das war jetzt die Theorie. Kommen wir jetzt endlich zur Praxis. Erst mal mit dem Positivbeispiel, was ich wirklich extrem beeindruckend fand. Ich habe nämlich einfach gesagt: Ich möchte ein Spiel programmiert haben, was richtig doll Spaß macht, aber auch beeindruckend gut aussieht. Bitte frag mich nichts, denk dir einfach irgendwas aus. Ich möchte gleich einfach ein wirklich tolles Spiel spielen. Okay, lass dir so lange Zeit, wie du willst.

Ja, und dann hat es vier Minuten gedauert, und ich habe eine ZIP-Datei bekommen. Und die habe ich ausgepackt und das gestartet, und das lief auf Anhieb. Und ich habe ja schon viel mit Vibe-Coding und irgendwelchen Coding-Tools rumhantiert, aber so ein One-Shot – also dass das wirklich alles auf Anhieb funktioniert, auch wirklich alles, ohne irgendwelche Fehler oder so –, das habe ich, glaube ich, wirklich noch nie gehabt.

Also ich musste immer erst mal: funktioniert nicht, bisschen hin und her. Aber so, zack – das habe ich wirklich noch nicht gesehen. Das Spiel war halt nur ein bisschen langweilig. Ich habe dann gesagt: Kannst du noch ein bisschen Sound und vielleicht so Extra-Waffen dazu bauen oder so? Bisschen simpel alles gerade. Das hat dann nochmal neun Minuten gedauert – also war offenbar schwieriger, als das Grundspiel zu bauen. Aber das hat dann auch auf Anhieb funktioniert, und das hatte dann Sound und es hatte Extra-Waffen und hatte aufsammelbare Extras, und Spaß hat das vielleicht für eine Minute gemacht. Aber immerhin: hat Spaß gemacht für eine Minute.

Aber gerade bei solchen Extrawünschen, nachdem das Ganze fertig ist, da haben laut meiner Erfahrung bisherige Coding-Tools immer gerne zusätzliche Fehler eingebaut. Hier halt nicht.

Und dann dachte ich mir: War das jetzt einfach Glück? Und dann habe ich mir noch einen Minesweeper-Klon mit c’t-3003-Grafik rausgelassen. Vielleicht erinnert sich noch jemand: Minesweeper war bei fast allen Windows bis Windows 8 vorinstalliert. Ja, und hier hat der erste Versuch dann zu einer Fehlermeldung geführt. Ich habe dann einfach die Fehlermeldung weitergegeben – also Screenshot gemacht, hingeschickt, „hier, Fehlermeldung“ – und kurz darauf hat es dann geklappt. Das Titelbild war ein bisschen kaputt, aber das Spiel hat funktioniert. Und ich sag mal: Die Sound-Effekt-Auswahl, die ist … interessant.

Ja, ich habe zwar gesagt, die Soundeffekte dürfen ruhig lustig sein – also so „oh nein, ein Bombe“ –, aber das Sample, was er da ausgesucht hat, ist dann doch unangenehm.

Praxisbeispiel 2: Manipulieren von Dateien

Und dann wollte ich mal gucken, wie der Agent so mit Dateien umgehen kann, zum Beispiel mit Bildern. Weil ich habe das schon ziemlich oft gehabt, dass ich ganz viele falsch gedrehte Bilder richtig drehen musste. Und das war dann immer ziemlich frickelig und ein großer manueller Aufwand. Deshalb habe ich jetzt einfach mal ein paar unterschiedlich gedrehte Bilder in eine ZIP-Datei geschmissen und gesagt: „Dreh mir die mal korrekt hin und benenne mir die direkt irgendwie sinnvoll.“ Und das Benennen hat gut funktioniert, aber das Drehen nur bei vier von sechs Bildern. Und genau diese kleinen Fehler, die sind ein großes Problem.

Praxisbeispiel 3: Übertragen von Informationen aus einem Video in eine Tabelle

Guck mal hier: Ich habe den Agenten zum Beispiel gebeten, die Linux-Gaming-Benchmark-Ergebnisse aus diesem YouTube-Video hier in eine Tabelle reinzuschreiben – einfach, weil ich das Video interessant finde und alle Ergebnisse gerne mal an einem Ort sehen wollte, statt mich so durch das Video skippen zu müssen.

Ja, und das hat auch erst mal funktioniert – also nachdem der Agent erst mal daran gescheitert ist, das Video auf YouTube überhaupt aufzurufen und dann Dinge gemacht hat, die ziemlich sicher gegen die YouTube-Nutzungsbedingungen verstoßen, was ich auch deshalb hier nicht im Detail zeigen will, weil mir YouTube sonst womöglich das Video sperrt. Das sollen OpenAI und Google mal schön unter sich ausmachen. Da habe ich nichts mit zu tun.

Am Ende hat der Agent es jedenfalls irgendwie hinbekommen, die Benchmark-Daten aus dem Video zu extrahieren. Aber da waren dann einfach stumpf Fehler drin. Ich vermute, dass der da intern mit einer zu geringen Auflösung gearbeitet hat und deshalb die Texterkennung hier einmal 8 als 3 erkannt hat. Dass ich das gemerkt habe bei den ganzen Zahlen in der Tabelle, die größtenteils richtig waren – das war eher so Glückssache.

Aber sowas kann natürlich doll ins Auge gehen, wenn man sich darauf verlässt und das für wichtige Dinge verwendet.

Beim anderen YouTube-Video mit Zahlen drin hat der Agent einfach den größten Teil ausgelassen, ohne mir das von sich aus mitzuteilen. Also er hat zwar gesagt, dass einige Zahlen schwer zu lesen waren – was nicht stimmt, also zumindest meine Mensch-Augen konnten die sehr gut lesen –, aber er hat halt einfach einen Großteil überhaupt ausgelassen der Informationen.

Und darauf habe ich dann den Agent angesprochen, und er hat dann so ein bisschen wie ein Schüler reagiert, der die Hausaufgaben nicht gemacht hat. Ja, nee, da war halt irgendwie so viel. Also O-Ton, was der Agent geantwortet hat: „Für eine vollständige Tabelle müssten alle Benchmark-Screenshots manuell und in Ruhe ausgewertet werden, was in dieser Umgebung leider nicht machbar ist.“ Also so irgendwie zu laut oder so. Ich weiß nicht, hat mich nicht überzeugt. Die Ausrede auf jeden Fall.

Praxisbeispiel 4: Recherche und Präsentation

Vielleicht klappt es ja besser mit Business-Sachen. Ich habe dann gesagt: „Mach mir mal eine Präsentation, womit ich die heise-Geschäftsführung beeindrucken kann, wie doll c’t 3003 ist.“ Ja, und was da dann rauskam – das ist halt wirklich, kann’s nicht anders sagen: Das ist so total generische KI-Plörre. Also etwas, was die meisten Leute, die schon mal mit KI gearbeitet haben, auch als KI-generiert erkennen würden.
Also schon dieses hässliche Bild hier. Da hätte man ja auch einfach das Logo nehmen können. Das findet man ja im Netz.

Dann hier die Kurve mit dem Abo-Wachstum. Ja, okay, die Zahlen stimmen. Aber die Legende hier rechts, das ist schon ziemlich Larifari. Und es sind da halt auch Fehler drin. Also pro Video bis zu 200K. Ich habe gerade mal geguckt, wir hatten schon 37 Videos, die deutlich über 200K lagen. Das ging hoch bis 800.000 oder so.

Und wenn ich sage, ich will mit einer Präsentation Leute beeindrucken, dann sollte man solche Sachen vielleicht richtig machen. Also gerade, wenn es um hohe Zahlen geht. Und dann halt so random Zeug wie: 67 % wollen Hintergründe verstehen. Ja klar, wollt ihr da draußen Hintergründe verstehen. Für mich jetzt nicht so eine interessante Information. Und 82 % waren gestern schon auf YouTube. Okay, ja, ist das wichtig in dieser Präsentation?

Ja, und dieses Balkendiagramm hier ergibt irgendwie gar keinen Sinn. Da sind dann auch nochmal richtige Fehler drin. Denn c’t 3003 hat keinen WhatsApp-Kanal. Und auch hier steht wieder die völlig weirde Info, dass 82 % der Leute, die c’t 3003 gucken, auch schon gestern auf YouTube waren.

Ja, und dann zum Schluss so stumpf: Unterstützt c’t 3003. Und dann aber auch am Ende nochmal viel zu doll in die Superlativ-Kiste gegriffen. Wir sind sicherlich nicht Europas führender Tech-Channel. Das wäre auch ziemlich peinlich, wenn ich das sagen würde zu irgendwem.

Also ich kann aus dieser Präsentation, weiß nicht, vielleicht 20 % verwenden, wenn ich die wirklich vor Leuten halten würde. Der Rest ist Schund. Und ganz ehrlich: Wenn mir so eine Präsentation gezeigt werden würde, mit diesen Quatschfolien und den offensichtlichen Fehlern, und wo man auch deutlich erkennen kann, dass das KI-generiert ist – also diese Person würde bei mir jetzt nicht unbedingt Pluspunkte sammeln.

Praxisbeispiel 5: Einen Hit produzieren

Und als Letztes wollte ich nochmal wissen, wie der Agent eigentlich Websites bedient, die ein Login brauchen – wie so gut wie alle Musikgenerierungsdienste.

Ich habe also den Agenten gefragt, dass er mir drei Ballermann-Party-Songs mit Technikthemen machen soll. Was mit UDIO oder ZUNO – hatten wir schon mal ein Video dazu gemacht – und wie die alle heißen, ziemlich unproblematisch klappt. Hat der Agent aber nicht gemacht, sondern irgendwelche anderen komischen Dienste verwendet.

Und ja, dann kamen dann die drei Songs: „Techno auf Mallorca“, „Serverparty in Palma“, „Schaltkreis im Strand“ und darunter dann: „Dieses Lied erzählt von einem Schaltkreis, der am Strand zwischen Liegestühlen zur Partydeko wird.“ Das ist schon ziemlich schlimm, aber das klingt noch viel schlimmer. Möchte ich eigentlich gar nichts zu sagen.

Ja, ich habe dann aber auf jeden Fall zum Agenten gesagt, er soll ZUNO oder UDIO verwenden. Ja, und dann hat er gesagt: Ja, ich habe ja keinen Account. Ich übergebe dir mal das Browser-Fenster und du kannst dich einloggen. Und da steht auch: OpenAI kann nicht mitlesen, wenn du hier Logins eingibst und so.

Ich rate euch aber ganz deutlich davon ab, irgendwelche wichtigen Logins oder womöglich sogar Geldsachen in dieses ChatGPT Agent-Browser-Fenster einzugeben, das auf irgendeiner virtuellen Maschine sonst wo läuft und niemand so richtig weiß, was damit eigentlich passiert. Also das nur kurz als Warnung.

Ich habe das mit einem wertlosen Test-Account versucht, der keinerlei persönliche Daten verknüpft hat. Aber das ging auch gar nicht, weil Google beim Login direkt sagt: Dieser Browser ist nicht sicher. Das könnte noch ein größeres Problem für den ChatGPT Agent werden, wenn nämlich Webdienste ihn erkennen und direkt ausschließen.

Wie kommt man an den ChatGPT Agent?

Ja, und ganz wichtig natürlich noch: Wie kommt man denn überhaupt an den ChatGPT Agent? Ja, dafür braucht man bislang einen der kostenpflichtigen ChatGPT-Tarife, also Plus, Pro oder Team. Ich habe es mit einem Plus-Account getestet und hatte damit 40 Agent-Benutzungen drin – wurde mir zumindest angezeigt. Letztendlich war mein Kontingent aber schon nach weniger als der Hälfte der Benutzung leer. Das ist also ziemlich intransparent und womöglich auch buggy.

Ich hatte das nämlich im Test mehrfach, dass der Agent sich in einer Aufgabe deaktiviert hat und er dann mit dem normalen ChatGPT-Modus weitergemacht hat. Also da ist auf jeden Fall noch Verbesserungspotenzial.

Fazit

Also ihr werdet jetzt nicht von mir hören: KI-Agenten werden alles verändern! Rette sich, wer kann! Milliarden Menschen werden arbeitslos! Auf jeden Fall werden mit dieser Version des ChatGPT Agent wenig bis gar keine Menschen arbeitslos, weil es dafür noch nicht gut genug funktioniert.

Also ich fand einige Dinge beeindruckend, wie gesagt – also diese One-Shot-Programmiersachen oder auch, dass so Bestell-Websites schon ganz gut bedient werden konnten. Man sieht aber deutlich, wenn man dem Agent da so zuguckt, was er so macht: Das ist alles sehr, sehr umständlich und sehr, sehr Brute-Force-mäßig. Und der Agent auch einfach oft daneben klickt und überhaupt nicht richtig versteht, was er da tut.

Mich hat das ein bisschen an diese Infinite-Monkey-Theorie erinnert, also dass ein Affe, der irgendwas auf einer Tastatur tippt, irgendwann jeden beliebigen Text geschrieben haben wird. Also so schlimm ist es natürlich nicht, aber es ist halt nicht elegant, sagen wir mal so, sondern sehr Trial-and-Error. Aber das wird mit der Zeit sicherlich besser werden, da bin ich mir einigermaßen sicher.

Aber das große Problem mit den Fehlern – also den Halluzinationen, die halt bei LLMs immer auftreten –, das kann wohl niemand Seriöses voraussehen, wann und vor allem, ob dieses Problem behoben wird. Stand heute tauchen jedenfalls beim ChatGPT Agent bei meinen Tests regelmäßig solche Fehler auf – also falsch erkannte Zahlen oder dass c’t 3000 ein WhatsApp-Kanal hat und alles so einfach halluzinierte Dinge.

Und das habe ich dann davon, wenn ich die Ergebnisse dann fummelig und mühselig selbst überprüfen muss. Da habe ich dann nicht wirklich viel Zeit gespart.

Also ich werde jetzt auch nicht den KI-Super-Pessimisten spielen, denn da ist schon ein großes Potenzial zu spüren. Es ist auch wirklich deutlich besser als die Agenten, die ich bisher gesehen habe. Aber es wäre unseriös zu sagen: Das wird sich so und so entwickeln und bis dahin sind die und die Probleme gelöst.

Und ich weiß halt auch nicht, was passieren würde, wenn die Probleme gelöst werden und KI-Agenten tatsächlich einen Großteil der berufstätigen Menschen ersetzen, wenn diese Agenten fehlerfrei arbeiten würden und das alles noch ein bisschen besser hinbekommen würden. Dann ist da auf jeden Fall das Potenzial, viele Stellen zu ersetzen.

Was ich auf jeden Fall sicher weiß: Dass der ChatGPT Agent aktuell oft mit sehr hohem Energieeinsatz, sprich Serverlast, irgendwelche Dinge versucht, mit Gewalt zu lösen – also viel Energie reinsteckt, um einen Mausklick oder so hinzubekommen. Also Dinge, die Menschen mit deutlich weniger Energie bewerkstelligen können.

Ja, was meint ihr? Wie geht das weiter mit den KI-Agenten? Gerne in die Kommentare schreiben. Ich lese wirklich alles und beantworte auch eure Fragen, zumindest an den ersten Tagen nach der Veröffentlichung. Tschüss!

c’t 3003 ist der YouTube-Channel von c’t. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen, Lukas Rumpler, Sahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.

(jkj)

Source link

Verwandte Themen:Agent beeindruckend C.ChatGPT claude Durchaus Entertainment Grok IT KI-Agenten Künstliche Intelligenz Llama OpenAI test Wissenschaft

Up Next

Supercomputer Stargate Norwegen: 230 Megawatt zum Start, bereit für 2,3 Gigawatt

Nicht verpassen

iPhone 17 Pro: Infos zu Spezialfarbe und großem Kamerarücken

Künstliche Intelligenz

KI: Apple steckt mehr Geld rein – verspricht weiter neue Siri für 2026

Der KI-Hype im Silicon Valley und an der Börse geht munter weiter – doch Apple lässt es weiter langsam angehen. Der Konzern vermarktet nach wie vor weder einen eigenen Chatbot noch Bezahldienste für Apple Intelligence mit mehr Power, setzt hingegen auf lokale Modelle und privatsphärengeschützte Cloud-Services. Auch bei den am Donnerstag bekannt gegebenen Quartalszahlen gab sich Apple im Hinblick auf KI eher schmallippig. Immerhin steigen die Investitionen.

Weiterlesen nach der Anzeige

Mehr Ausgaben für KI

So steigen die Capital Expenditures (CapEx, Investitionsausgaben) vor allem dank KI auf nun 18,1 bis 18,5 Milliarden Dollar. Laut Finanzchef Kevan Parekh ist das ein signifikanter Zuwachs. Die Betriebsaufwendungen speisen sich demnach vor allem aus Forschung und Entwicklung. „Wir erhöhen unsere Investitionen in KI und investieren gleichzeitig weiter in unsere Produkt-Roadmap.“ Konzernchef Tim Cook betonte, Apple sei nach wie vor offen für Aufkäufe. Auf die Frage, ob das auch für KI-Grundmodelle gilt, sagte er, Apple beobachte den Markt in diesem Hinblick weiter.

„Wir sind offen für Übernahmen, wenn wir glauben, dass dies unsere Roadmap voranbringt.“ Das Problem dabei: Die Preise für Aufkäufe im KI-Markt sind mittlerweile derart hoch, dass dies selbst für Apples tiefe Taschen zum Problem werden könnte. Bislang größte Übernahme des Konzerns war bislang der Audiohersteller und Musikstreaminganbieter Beats im Jahr 2014 – für aus KI-Marktsicht lächerliche drei Milliarden US-Dollar.

Siri kommt noch – mal wieder

Die übliche Frage, wie es denn Apples überarbeiteter Sprachassistentin Siri geht, die das Unternehmen verschieben musste, beantwortete ebenfalls Cook. Laut seiner Aussage sei man weiter „on track“ für eine Veröffentlichung im kommenden Jahr. Derzeit gibt es Hoffnung, dass es Frühjahr werden könnte, allerdings sollen die Teams unlängst intern Bedenken geäußert haben. Apple hat zudem bereits zahlreiche Mitarbeiter aus seiner KI-Abteilung an Konkurrenten verloren.

Cook wollte interessanterweise keine Angaben dazu machen, ob das Suchvolumen auf iPhone und Co. aufgrund von KI abnimmt – hier kassiert Apple mindestens 20 Milliarden Dollar von Google pro Jahr. Das Werbegeschäft, zu dem Apple neben selbst vermarkteter Werbung auch die Suchreklame via Google zählt, sei insgesamt gewachsen, so Cook und habe Rekordzahlen erreicht. Allerdings weigerte er sich, mitzuteilen, wie viel auf welchen Bereich entfällt. „Wir trennen das nicht auf diesem Niveau.“

Weiterlesen nach der Anzeige

(bsc)

Source link

Künstliche Intelligenz

Geplant: WhatsApp bekommt Apple-Watch-Anwendung | heise online

Zehneinhalb Jahre ist die Apple Watch bereits auf dem Markt – und gilt als meistverkaufte Smartwatch überhaupt. Dennoch hatte Meta bislang keine Anstalten gemacht, seinen populären Messenger-Dienst WhatsApp auf das Gerät zu holen, nur eine Weitergabe und Anzeige von Nachrichten vom iPhone war möglich. Nun soll es jedoch erstmals einen offiziellen Client für watchOS geben: In dieser Woche startete dazu über Apples Betaplattform TestFlight eine Versuchsphase auch für externe Benutzer, wobei diese wie üblich nur ausgewählten Usern zur Verfügung steht.

Weiterlesen nach der Anzeige

Grundfunktionen, aber iPhone-Zwang

Die App soll alle Grundfunktionen haben, die man auch von der iOS-Version kennt, wenn auch auf den Formfaktor der Uhr angepasst. Man kann WhatsApp-Nachrichten lesen, beantworten, Reaktionen senden, Sprachnachrichten verschicken und einiges mehr – auch wenn die Erfahrung derzeit noch „eingeschränkt“ sei, wie Tester berichten.

Laut WABetaInfo ist die Anwendung mit einer aktuellen WhatsApp-Beta für iOS (25.32.10.71) verknüpft, man muss also Teil auch dieses Betaprogramms sein. Offenbar handelt es sich bei WhatsApp für watchOS nicht um eine ohne iPhone nutzbare Anwendung, selbst wenn die Computeruhr für LTE oder 5G (ab Series 11 / Ultra 3) verfügt. Es gibt eine Chatliste, ein an watchOS angepasstes Interface und einen Synchronisationsbildschirm – geht die Verbindung zum iPhone verloren, bekommt man dies mitgeteilt.

Setup einfach, allgemeine Verfügbarkeit noch unklar

Insgesamt soll die Verwendung angenehmer sein als über die bislang nur möglichen Push-Benachrichtigungen auf der Computeruhr. Lobenswert: Das Setup der watchOS-Version erfolgt automatisch, es ist also nicht notwendig, den nervigen Link-Code zu kennen, wie man das von Mac oder PC kennt. watchOS 10 (aktuell ist watchOS 26) ist Mindestvoraussetzung. Wann die App allgemein freigegeben wird, bleibt abzuwarten – es könnte noch Monate dauern.

Ob Meta eine „echte“ watchOS-App plant, die auch ohne verbundenes iPhone auskommt, ist unklar. Wear OS, wo es schon seit Langem eine WhatsApp-Variante gibt, arbeitet genauso wie die nun freigegebene Beta der Apple-Watch-Variante – auch hier ist ein angebundenes Handy notwendig. Aktuelle Apple-Watch-Modelle sind durchaus in der Lage, komplexe Anwendungen auszuführen. Besonders beim Sport schätzen Nutzer, ihr iPhone dann zuhause lassen zu können.

Weiterlesen nach der Anzeige

(bsc)

Source link

Künstliche Intelligenz

#TGIQF: Das Quiz rund um Wikipedia

Die Online-Enzyklopädie Wikipedia ist noch immer eines der zentralen Orte im Netz, wenn es um Wissensbeschaffung geht. Seit fast 25 Jahren lässt sich in dem Mitmach-Projekt auf Millionen von Seiten sowie in Hunderten von Sprachen und Dialekten auch zum randständigen Nerdthema ein Artikel finden, sofern es ein Verfasser für lesenswert genug hielt.

Weiterlesen nach der Anzeige

„Thank God It’s Quiz Friday!“ Jeden Freitag gibts ein neues Quiz aus den Themenbereichen IT, Technik, Entertainment oder Nerd-Wissen:

Dabei hat die Wikipedia eine bewegte Zeit hinter sich. Als kompaktes Weltwissen gestartet, wuchs Wikipedia rapide und musste nicht einmal den Vergleich mit dem renommierten Encyclopædia Britannica scheuen, auch wenn die Möglichkeit, dass jedermann einen Artikel bearbeiten konnte, auch schon zu makaberen Studentenscherzen genutzt wurde, als der Erfinder der Eiffel-Programmiersprache einfach mal für tot erklärt wurde.

Nachdem nun Elon Musk ja meint, es sei eine Weltidee, mit etwas KI und gemopsten Inhalten eine eigene Online-Enzyklopädie zu erstellen, wollen wir uns im Freitagsquiz dem Original widmen. Achtung, jetzt kommt ein Karton – Äh… Quiz! In der heiseshow stellte Anna Bicker der Stammcrew Dr. Volker Zota sowie Malte Kirchner drei Fragen vorab: Die wandelnden Offline-Enzyklopädien mussten nicht einmal in den Kopf des Quizmasters gucken, sondern fanden in der Regel die richtige Antwort.

Die Uhr läuft mit und belohnt schnelles Raten in 10 Fragen mit maximal-satten 200 Punkten. Die Punktzahl kann gern im Forum mit anderen Mitspielern verglichen werden. Halten Sie sich dabei aber bitte mit Spoilern zurück, um anderen Teilnehmern nicht die Freude am Quiz zu verhageln. Lob und Kritik ist wie immer gern genommen.

Bleiben Sie zudem auf dem Laufenden und erfahren Sie das Neueste aus der IT-Welt: Folgen Sie uns bei Mastodon, auf Facebook oder Instagram. Und schauen Sie auch gern beim Redaktionsbot Botti vorbei.

Und falls Sie Ideen für eigene Quiz haben, schreiben Sie einfach eine Mail an den Quizmaster aka Herr der fiesen Fragen.

Weiterlesen nach der Anzeige

(mawi)

Source link

Der ultimative Guide für eine unvergessliche Customer Experience

UX/UI & Webdesignvor 2 Monaten

Der ultimative Guide für eine unvergessliche Customer Experience

UX/UI & Webdesignvor 2 Monaten

Adobe Firefly Boards › PAGE online

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Social Mediavor 2 Monaten

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Illustrierte Reise nach New York City › PAGE online

UX/UI & Webdesignvor 2 Wochen

Illustrierte Reise nach New York City › PAGE online

Posit stellt Positron vor: Neue IDE für Data Science mit Python und R

Entwicklung & Codevor 2 Monaten

Posit stellt Positron vor: Neue IDE für Data Science mit Python und R

EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events

Entwicklung & Codevor 2 Monaten

EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events

Fake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online

UX/UI & Webdesignvor 2 Monaten

Fake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online

Galaxy Tab S10 Lite: Günstiger Einstieg in Samsungs Premium-Tablets

Apps & Mobile Entwicklungvor 2 Monaten

Galaxy Tab S10 Lite: Günstiger Einstieg in Samsungs Premium-Tablets

Inspohub

Durchaus beeindruckend: ChatGPT Agent im Test

Künstliche Intelligenz

Durchaus beeindruckend: ChatGPT Agent im Test

Transkript des Videos

Was ist überhaupt ein KI-Agent?

Die etwas technischere Erklärung

Praxisbeispiel 1: Coding

Praxisbeispiel 2: Manipulieren von Dateien

Praxisbeispiel 3: Übertragen von Informationen aus einem Video in eine Tabelle

Praxisbeispiel 4: Recherche und Präsentation

Praxisbeispiel 5: Einen Hit produzieren

Wie kommt man an den ChatGPT Agent?

Fazit

Künstliche Intelligenz

KI: Apple steckt mehr Geld rein – verspricht weiter neue Siri für 2026

Mehr Ausgaben für KI

Siri kommt noch – mal wieder

Künstliche Intelligenz

Geplant: WhatsApp bekommt Apple-Watch-Anwendung | heise online

Grundfunktionen, aber iPhone-Zwang

Setup einfach, allgemeine Verfügbarkeit noch unklar

Künstliche Intelligenz

#TGIQF: Das Quiz rund um Wikipedia

Unsere Einnahmen und Ausgaben und verschiedene Hüte

IBM übernimmt Txture – Evertrace kauft Morphais – IBB Ventures investiert in Omria

Kult-Limo: Bionade holt Ricola-Manager als neuen Marketingchef

Der ultimative Guide für eine unvergessliche Customer Experience

Adobe Firefly Boards › PAGE online

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Beliebt

Inspohub

Durchaus beeindruckend: ChatGPT Agent im Test

Transkript des Videos

Was ist überhaupt ein KI-Agent?

Die etwas technischere Erklärung

Praxisbeispiel 1: Coding

Praxisbeispiel 2: Manipulieren von Dateien

Praxisbeispiel 3: Übertragen von Informationen aus einem Video in eine Tabelle

Praxisbeispiel 4: Recherche und Präsentation

Praxisbeispiel 5: Einen Hit produzieren

Wie kommt man an den ChatGPT Agent?

Fazit

Das könnte Ihnen gefallen

Künstliche Intelligenz

KI: Apple steckt mehr Geld rein – verspricht weiter neue Siri für 2026

Mehr Ausgaben für KI

Siri kommt noch – mal wieder

Künstliche Intelligenz

Geplant: WhatsApp bekommt Apple-Watch-Anwendung | heise online

Grundfunktionen, aber iPhone-Zwang

Setup einfach, allgemeine Verfügbarkeit noch unklar

Künstliche Intelligenz

#TGIQF: Das Quiz rund um Wikipedia

Unsere Einnahmen und Ausgaben und verschiedene Hüte

IBM übernimmt Txture – Evertrace kauft Morphais – IBB Ventures investiert in Omria

Kult-Limo: Bionade holt Ricola-Manager als neuen Marketingchef

Der ultimative Guide für eine unvergessliche Customer Experience

Adobe Firefly Boards › PAGE online

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Beliebt