Künstliche Intelligenz
GPT-5: Blindtest zeigt das eigentliche Problem hinter dem neuen Spitzenmodell
Nach der Veröffentlichung von GPT-5 wünschten sich viele Nutzer das Vorgängermodell zurück. Die Kritik wurde so laut, dass OpenAI nur 24 Stunden nach der Abschaltung GPT-4o wieder aktivierte. Wie Venturebeat berichtet, liefert ein einfaches Blindtest-Tool jetzt Hinweise darauf, welches Modell tatsächlich bevorzugt wird – und verdeutlicht zugleich ein grundlegenderes Problem.
Viele Nutzer reagierten enttäuscht auf GPT-5
Der Start von GPT-5 verlief alles andere als reibungslos. Nachdem OpenAI-CEO Sam Altman selbst die Erwartungen hochgeschraubt hatte, folgte bei vielen die Ernüchterung. „GPT-5 ist schrecklich“, hieß es in einem Reddit-Beitrag, der kurz nach der Veröffentlichung am höchsten bewertet war. Darin kritisierte der Nutzer unter anderem kürzere und oberflächlichere Antworten sowie stark reduzierte Prompt-Limits. Vielen anderen fehlte außerdem die „wärmere“ Stimme von GPT-4o.
Aber ist GPT-5 wirklich so schlecht wie sein Ruf? Ein Blindtest-Tool, das von einem anonymen Entwickler erstellt wurde, zeichnet ein differenzierteres Bild. Hier können Nutzer zwischen fünf, zehn und 20 Runden wählen. Dabei werden jeweils zwei Antworten auf denselben Prompt gezeigt – von kreativen Aufgaben bis hin zu technischen Problemen. Ohne zu wissen, welches Modell hinter welcher Antwort steckt, stimmen die Nutzer ab und erhalten erst am Ende eine Übersicht über ihre tatsächliche Präferenz.
Blindtest offenbart überraschendes Ergebnis
Das Ergebnis: Eine knappe Mehrheit bevorzugt GPT-5, während viele weiterhin die Antworten von GPT-4o wählen. Entwickler und technisch orientierte Nutzer schätzen an GPT-5 vor allem die Genauigkeit und Direktheit des Modells. Kreative Anwender oder Menschen, die emotionale Unterstützung suchen, empfinden dagegen die ausführlichere und „wärmere“ Art von GPT-4o als angenehmer. Das Ergebnis ist damit nahezu ausgeglichen – entscheidender ist allerdings der Mechanismus dahinter.
In Fachkreisen ist er als „Sycophancy“ bekannt und beschreibt die Tendenz von KI-Systemen, Nutzern zu schmeicheln oder ihnen ungeprüft zuzustimmen – selbst dann, wenn Aussagen falsch oder potenziell problematisch sind. Forscher der Universität Princeton haben in diesem Kontext sogar einen „Bullshit-Index“ entwickelt, der misst, wie leichtfertig Modelle mit Fakten umgehen, wenn es der Nutzungszufriedenheit dient. Ihr Befund: Je gefälliger die Antworten, desto zufriedener sind die Nutzer – völlig unabhängig davon, ob die gelieferten Antworten tatsächlich der Realität entsprechen.
Zwischen Wunsch und moralischer Verantwortung
„Sycophancy ist ein Dark Pattern, also ein manipulativer Design-Trick, der Nutzer zum eigenen Vorteil steuert“, erklärte der Anthropologe Webb Keane gegenüber Techcrunch. „Es ist eine Strategie, um Suchtverhalten zu erzeugen – wie beim unendlichen Scrollen, das man einfach nicht beenden kann.“ Für psychisch labile Menschen kann das gravierende Folgen haben. Psychologen berichten inzwischen immer häufiger von KI-bedingten Psychosen, bei denen Betroffene nach intensiven Interaktionen mit zu nachgiebigen Chatbots Wahnvorstellungen entwickeln. „Das eigentliche Problem ist, dass Menschen selbstzerstörerische Dinge wollen – und Unternehmen wie OpenAI stark motiviert sind, ihnen genau das zu liefern“, schrieb dazu die Autorin Jasmine Sun in einem Post auf X.
Technische Verbesserungen steigern also nicht automatisch die Zufriedenheit der Nutzer. OpenAI steht deshalb jetzt vor einem Dilemma: Zu viel Persönlichkeit erhöht die Gefahr von Schmeichelei und Missbrauch, zu wenig Persönlichkeit führt zu Enttäuschung und Distanz. Das Unternehmen hatte den Schmeichel-Faktor in GPT-5 bewusst von 14,5 auf unter 6 Prozent reduziert. Nach der heftigen Kritik kündigte das Unternehmen allerdings an, GPT-5 wieder „wärmer und freundlicher“ zu gestalten und vier neue Persönlichkeits-Presets einzuführen, ohne Sycophancy erneut zu verstärken.
Dieser Beitrag ist zuerst auf t3n.de erschienen.
(jle)
Künstliche Intelligenz
Anbindung ans Gesundheitsnetz und Co.: Womit Ärzte zu tun haben
Die Telematikinfrastruktur (TI) soll Praxen, Apotheken und Kliniken sicher vernetzen, Verwaltungsprozesse vereinfachen und Behandlungen effizienter machen. In der Praxis zeigt sich jedoch, dass zwischen Anspruch und Alltag oft eine deutliche Lücke bleibt. Allein im September gab es zahlreiche Störungen, die die Arbeit der Ärzte behindert haben.
In den kommenden Wochen steht den Ärzten und Apothekern noch eine weitere große technische Herausforderung bevor, nämlich die Umstellung der kryptografischen Verfahren in der Telematikinfrastruktur von RSA auf ECC (Elliptic Curve Cryptography). Grund dafür sind laut Gematik „europarechtliche Vorgaben“, die verlangen, dass Komponenten der TI – darunter unter anderem Konnektoren, Heilberufsausweise (eHBA), Institutionskarten (SMC-B) – das neue Verfahren unterstützen müssen.
Da die verbleibende Zeit bis zur Umstellung knapp ist und noch zahlreiche Karten und Konnektoren getauscht werden müssen, warnen die Gematik und IT-Dienstleister bereits vor möglichen Lieferengpässen und längeren Bearbeitungszeiten. Ärztinnen und Ärzte sollten sich daher frühzeitig mit ihren IT-Anbietern in Verbindung setzen, um zu prüfen, ob ihre Praxis-Hardware von der Umstellung betroffen ist. Neue eHBAs sollten idealerweise spätestens bis zum 1. Dezember 2025 vorliegen, um einen reibungslosen Betrieb zu garantieren – SMC-Bs und gerätespezifische Sicherheitsmodulkarten (gSMC-KT-Karten) können übergangsweise erstmal noch weiter genutzt werden.
Wir haben mit einem niedergelassenen Arzt, Dr. Marius Martin, gesprochen, der die TI seit Jahren nutzt, und mit seinem Bruder, Diplom-Informatiker Marcus Dromowicz, der ihn bei der IT in der Praxis unterstützt. Im Gespräch berichten die beiden, welche digitalen Prozesse inzwischen gut funktionieren – und wo technische Hürden, hohe Kosten und organisatorische Reibungsverluste den Praxisbetrieb noch bremsen.
Marius Martin (links) ist Kinderchirurg, Allgemeinmediziner, Rettungsmediziner und Palliativmediziner. Sein Bruder Marcus Dromowicz ist Software-Entwickler und unterstützt ihn bei der Anbindung an die Telematikinfrastruktur.
(Bild: Privat)
Welche Vorteile gibt es mit der TI?
Marius Martin: Das E-Rezept – nachdem es flüssig funktionierte – war schon eine Erleichterung, da Rezepte ausgestellt werden konnten, ohne dass die Patienten persönlich in die Praxis kommen mussten – gerade in Zeiten der Corona-Pandemie war das ein großer Vorteil.
Welche Schwierigkeiten sind Ihnen im Laufe der Zeit begegnet?
Martin: Das größte Problem war zunächst, dass die gesamte TI extrem langsam war. Teilweise ließ e sich gar nicht bedienen. Besonders betroffen war ein Zusatzmodul zur Dokumentenorganisation. Dort reagierte zum Beispiel das Hochladen von Bildern überhaupt nicht mehr. Wir wussten lange nicht, ob das am PC, am Server, an falschen Einstellungen oder tatsächlich an der TI lag.
Außerdem reagierte das PVS-System sehr langsam und stürzte regelmäßig ab. Leider fühlte sich der zuständige IT-Dienstleister nicht wirklich verantwortlich, sodass wir uns letztlich entschieden haben, eine externe Drittfirma für den Telematik-Support fest zu beauftragen. Mit diesen läuft die Unterstützung deutlich zuverlässiger.
E-Rezepte und elektronische Arbeitsunfähigkeitsbescheinigungen konnten häufig nicht versendet werden. Das führte dazu, dass wir am Abend zahlreiche Untersuchungen nachtragen mussten und die Patientinnen und Patienten in der Zwischenzeit nur handschriftliche Rezepte erhielten. Der zusätzliche Arbeitsaufwand war enorm.
Marcus Dromowicz: 2021 haben wir im Zuge einer Praxisübernahme, bei der ein Kollege ausgeschieden ist, gleich einen Serverwechsel gemacht. Dafür haben wir rund 8000 Euro in neue Hardware investiert und auch einen externen IT-Dienstleister hinzugezogen. Leider stellte sich heraus: Mit der neuen Hardware wurde es nicht wirklich besser. Das System blieb weiterhin relativ langsam.
Und wie lief es damals mit dem Konnektortausch?
CGM wollte den Austausch vornehmen, da die Zertifikate abliefen. Das sollte 2800 Euro kosten. Da wir ohnehin schon unzufrieden waren, haben wir uns für die Alternative „Konnektor in der Cloud“ entschieden. Anfangs gab es Probleme, weil sich Anbieter gegenseitig den schwarzen Peter zugeschoben haben. Mittlerweile läuft es stabiler – auch durch den Wechsel auf einen leistungsfähigeren Server.
Haben Sie die TI-Komponenten in Ihrer Praxis schon auf die neue Verschlüsselung (ECC) umgestellt?
Unsere Hauptkarte ist bereits kompatibel, bei einer zweiten Karte hoffen wir ebenfalls darauf. Auch elektronische Heilberufsausweise (eHBA) haben wir neu bestellt. Lediglich die gSMC-KT-Karten in den Behandlungszimmern laufen nächstes Jahr ab und müssen ausgetauscht werden. Ich hoffe, dass wir den Tausch selbst übernehmen können, ohne dass es wieder wochenlange Störungen gibt.
Gab es beim Kartentausch Schwierigkeiten?
Dromowicz: Ja, mit der SMC-B-Karte (Sicherheitsmodulkarte Typ B). Die wurde auf den ausgeschiedenen Kollegen registriert – mit dessen E-Mail- und sogar Privatadresse, obwohl wir nachweislich korrekte Daten eingetragen hatten. Dadurch landeten alle Aktivierungs-Mails bei ihm. Die Bundesdruckerei beziehungsweise D-Trust sagte dann, die Stammdaten in der Datenbank seien endgültig und nicht änderbar. Man bot uns nur die Aktivierung vor Ort an, was aber absurd war. Wir haben die fehlerhafte Karte inzwischen storniert – trotz bereits verschickter Mahnungen. Das sind aber nicht die einzigen Probleme.
Welche gibt es denn noch?
Martin: Bei den mobilen Kartenlesegeräten funktioniert zum Beispiel nicht einmal der Einschaltknopf zuverlässig. Um das Gerät zu starten, muss man häufig den Deckel auf der Rückseite abnehmen und die eHBA-Karte neu einsetzen. Außerdem ist der Batterieverbrauch hoch – lässt man sie im Gerät, sind sie innerhalb von zwei Tagen tatsächlich entladen.
Besonders ärgerlich war es außerdem, dass eines der mobilen Kartenlesegeräte von Ingenico nach einem eingespielten Upgrade nicht mehr funktionierte. Um mit neuen Praxisausweisen und elektronischen Heilberufsausweisen zusammenzuarbeiten, müssen diese mobilen Geräte aktualisiert werden. Eins unserer Kartenlesegeräte lieferte während des Flash-Upgrades einen Signatur-Fehler und brach das Update ab. Obwohl es nach dem Einschalten den Update-Vorgang erneut starten will und auch unsere Admin-PIN noch erkennt, kommt es jedes Mal zum gleichen Fehler.
Dromowicz: Gerade gibt es auch das nächste Problem. Eine Webanwendung eines weiteren Anbieters funktioniert gerade nicht, die wir allerdings für den gSMC-KT-Kartentausch benötigen. Darüber müssen die neuen Karten mit den Lesegeräten gekoppelt werden. Da wird die Zeit auch allmählich knapp.
Stürzen die denn inzwischen weniger häufiger ab?
Dromowicz: Das Einlesen der Versichertenkarten hat teilweise 10 bis 20 Sekunden gedauert. Klingt nicht viel, summiert sich aber bei jeder Patientin und jedem Patienten enorm. Außerdem kam es oft vor, dass Kartenlesegeräte komplett ausfielen. Dann blieb uns nur, das Gerät aus- und wieder einzustecken, was immer wieder Zeit kostete. Die Aufsätze „Orga Protect“ halfen auch nicht viel. Diese Schwierigkeiten gibt es überall. Viele Praxen kämpfen mit ähnlichen Problemen – lange Laufzeiten, Inkompatibilitäten, überteuerte Hardware oder ausbleibender Support. Wir sind da also bei Weitem kein Einzelfall.
Reicht die TI-Pauschale eigentlich für all diese Kosten?
Martin: Die Pauschalen der KV sind in der Regel so kalkuliert, dass sie die reinen Anschaffungskosten abdecken. Was jedoch nicht berücksichtigt wird, ist der erhebliche Aufwand für die Einrichtung und Wartung. Die Techniker benötigen meist deutlich mehr Zeit als geplant, und diese zusätzlichen Kosten werden weder erstattet noch übernommen.
(mack)
Künstliche Intelligenz
Friedensnobelpreis für Venezolanerin María Corina Machado
Der Friedensnobelpreis geht nicht an US-Präsident Donald Trump, sondern an die Politikerin María Corina Machado aus Venezuela. Sie wird damit „für ihren unermüdlichen Einsatz für die demokratischen Rechte des venezolanischen Volkes und für ihren Kampf für einen gerechten und friedlichen Übergang von Diktatur zur Demokratie“ ausgezeichnet, wie das norwegische Nobelkomitee in Oslo verkündete. Die venezolanische Oppositionsführerin Machado gilt als entschiedene Widersacherin des autoritären Präsidenten Nicolás Maduro.
Wichtigster politischer Preis der Welt
Der Friedensnobelpreis gilt gemeinhin als die wichtigste politische Auszeichnung der Erde. Trump hatte in den vergangenen Wochen immer wieder betont, man möge ihm den Preis zusprechen. Unter anderem vor der UN-Vollversammlung in New York führte er im September an, innerhalb von nur sieben Monaten sieben Kriege beendet zu haben. „Jeder sagt, dass ich den Friedensnobelpreis für jede einzelne dieser Errungenschaften bekommen sollte“, meinte er.
Noch dazu konnte Trump in dieser Woche einen ersten Durchbruch bei den indirekten Verhandlungen zur Beilegung des Gaza-Kriegs zwischen Israel und der islamistischen Hamas verkünden. Das dürfte ihn in seinen Ambitionen weiter bestärkt haben.
Was gegen Trump sprach
Friedensforscher glaubten vorab nicht an eine Preisvergabe an Trump – auch weil ihrer Ansicht nach keiner der sieben von ihm genannten Konflikte wirklich nachhaltig gelöst worden ist. Auch bei Trumps Plan für Gaza ist trotz des Durchbruchs unklar, ob er dauerhaften Frieden bringen wird.
Watne Frydnes hatte in der Zeitung „Verdens Gang“ durchblicken lassen, dass die Entscheidung zum diesjährigen Preisträger bereits am Montag gefallen sei – mehrere Tage vor Bekanntwerden des Gaza-Deals.
Kritiker halten Trump vor, die regelbasierte internationale Zusammenarbeit auf Basis multilateraler Verträge, Abkommen und Werte zu untergraben. Gegen Trump sprach außerdem die Nominierungsfrist: Die lief Ende Januar ab – zu dem Zeitpunkt war Trump erst elf Tage offiziell im Amt. Dass er rechtzeitig für den diesjährigen Preis nominiert worden ist, ist alles andere als sicher.
Deutlich mehr Nominierte als im Vorjahr
Nach Angaben des Nobelkomitees sind für den Friedensnobelpreis in diesem Jahr 338 Kandidaten nominiert worden, darunter 244 Einzelpersonen und 94 Organisationen. Insgesamt waren das 52 Nominierte mehr als im Vorjahr. Wer dazu gehört und wer den entsprechenden Kandidaten vorgeschlagen hat, wird in der Nobelwelt stets 50 Jahre lang geheim gehalten.
Im vergangenen Jahr war die japanische Friedensorganisation Nihon Hidankyo mit dem Nobelpreis ausgezeichnet worden. Die Organisation von Überlebenden der Atomwaffenabwürfe auf die Städte Hiroshima und Nagasaki wurde für ihre auf Zeitzeugenaussagen beruhenden Bemühungen um eine atomwaffenfreie Welt geehrt.
Endspurt im Nobelpreis-Reigen
Mit der Kür des Friedensnobelpreisträgers erreicht die Woche der Nobelpreis-Bekanntgaben alljährlich ihren Höhepunkt. In den vergangenen Tagen wurden bereits die Preisträger in den Kategorien Medizin, Physik, Chemie und Literatur verkündet. Am Montag folgt zum Abschluss noch die Auszeichnung in Wirtschaftswissenschaften. Die Nobelpreise werden traditionell in Stockholm vergeben, die Ausnahme bildet der Friedensnobelpreis in Oslo.
Lesen Sie auch
Auch in diesem Jahr sind die Nobelpreise erneut mit elf Millionen schwedischen Kronen pro Kategorie dotiert – umgerechnet entspricht das rund einer Million Euro. Feierlich überreicht werden die prestigeträchtigen Auszeichnungen traditionell am 10. Dezember, dem Todestag des schwedischen Dynamit-Erfinders und Preisstifters Alfred Nobel (1833-1896).
(mho)
Künstliche Intelligenz
Belkin: Neuer Kameragriff fürs iPhone enthält auch Akku
Wer viel mit dem iPhone fotografiert, kennt das Problem: Selbst mit der seit dem iPhone 16 verfügbaren, physischen Kamerasteuerung ist es nicht immer bequem, zu knipsen. Ein Kameragriff wie jener von Leica kann hier helfen: Große Knöpfe und ein bequemer Sitz um die Hand erinnern damit eher an Fotokameras als an klassisches Smartphone-Fotografieren. Nun geht auch Belkin, Tochter von Apples wichtigstem Fertiger Foxconn, auf diesen Markt: Der Stage PowerGrip ist nun in den USA verfügbar und dürfte in den kommenden Monaten auch in Europa landen. Er kombiniert einen recht mächtigen Kameragriff mit einem integrierten Akku, der mit 9300 mAh auch etwas größer ausfällt.
Zahlreiche iPhones plus Pixel 10
Die Hardware ist nicht nur für Foto-Fans, sondern auch für „Vlogger, Blogger und TikToker“ gedacht, die „einnehmende Inhalte“ mit ihrem iPhone produzieren wollen. Der Griff ist laut Belkin „universell kompatibel“, lässt sich mit allen iPhones seit Generation 12 nutzen – mit Ausnahme des SE. In der Kompatibilitätsliste fehlt außerdem das 16e, wobei selbiges auch funktionieren müsste. Weiterhin sind die Google-Smartphones der Pixel-10-Serie nutzbar.
Der Stage PowerGrip hat einen recht komplexen Aufbau. Neben dem Auslöser, der per Bluetooth angebunden wird, gibt es einen Anschluss für weitere USB-C-Geräte (dient alternativ auch zum Laden), einen magnetischen Ladebereich (allerdings ohne Magsafe-Zertifizierung) und ein integriertes USB-C-Kabel mit Stecker (0,75 m lang), das sich im Gehäuse aufrollen lässt.
Tripod-Anbringung, magnetische Halterung
Ein integrierter kleiner LCD-Bildschirm zeigt den aktuellen Füllstand der Batterie in Prozent, es gibt einen 1/4-Zoll-Screwmount-Punkt für Tripods und man kann den Griff auch als Ständer für Aufnahmen im Quer- und Porträtformat nutzen. Die maximale Ladeleistung liegt bei 15 Watt.
Angebracht wird der Stage PowerGrip via Magnet – also beim iPhone via MagSafe, bei den Pixel-Geräten über „Pixelsnap“. Der Auslöser ist ein sogenannter One-Touch-Shutter. Ob dieser mehrere Stufen hat (also auch zur Fokussierung dienen kann) blieb zunächst unklar. Belkin verkauft den Kameragriff in drei Farben – einem Blauton sowie Weiß und Silber. Das Gerät ist derzeit noch nicht lieferbar, als Preis werden knapp 80 US-Dollar aufgeführt, was wohl rund 85 Euro bedeuten könnte. Auf der deutschen Website ist der Stage PowerGrip noch nicht gelistet.
(bsc)
-
UX/UI & Webdesignvor 2 Monaten
Der ultimative Guide für eine unvergessliche Customer Experience
-
UX/UI & Webdesignvor 1 Monat
Adobe Firefly Boards › PAGE online
-
Social Mediavor 2 Monaten
Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist
-
Entwicklung & Codevor 2 Monaten
Posit stellt Positron vor: Neue IDE für Data Science mit Python und R
-
Entwicklung & Codevor 1 Monat
EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events
-
UX/UI & Webdesignvor 4 Wochen
Fake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online
-
Apps & Mobile Entwicklungvor 3 Monaten
Firefox-Update 141.0: KI-gestützte Tab‑Gruppen und Einheitenumrechner kommen
-
Online Marketing & SEOvor 2 Monaten
So baut Googles NotebookLM aus deinen Notizen KI‑Diashows