Entwicklung & Code

Apple-Studie: Nutzer wollen transparente KI-Agenten statt Black-Box-Systeme

Apple-Forscher haben in einer zweiphasigen Studie untersucht, wie Nutzer mit KI-Agenten interagieren möchten. Das Ergebnis ist überraschend: Menschen bevorzugen weniger leistungsstarke, sondern eher transparente Agenten gegenüber leistungsstarken Black-Box-Systemen. Die im Februar 2026 veröffentlichte Studie „Mapping the Design Space of User Experience for Computer Use Agents“ identifiziert vier zentrale Kategorien für das UX-Design und analysiert neun bestehende Systeme wie Claude Computer Use Tool, OpenAI Operator und Googles Project Mariner.

Weiterlesen nach der Anzeige

Die Forscher untersuchten in Phase 1 ihrer Studie neun kommerzielle KI-Agent-Systeme und führten Interviews mit acht UX- und KI-Praktikern aus großen Technologieunternehmen. In Phase 2 testeten sie ihre Erkenntnisse mit 20 Teilnehmern in einem sogenannten Wizard-of-Oz-Experiment. So wird ein Versuch bezeichnet, bei dem ein Mensch (Proband) annimmt, mit einem autonomen (im Sinne der künstlichen Intelligenz) System zu kommunizieren, in Wirklichkeit aber mit einem Menschen interagiert. Die Probanden sollten Aufgaben wie Ferienwohnungsbuchungen oder Online-Shopping erledigen, während ein Forscher im Nebenraum die Agent-Aktionen simulierte. Die Teilnehmer konnten den vermeintlichen Agenten jederzeit mit einem Interrupt-Button stoppen. Die aufgezeichneten Videos und Chat-Logs lieferten Einblicke in die tatsächlichen Nutzererwartungen.

Transparenz wichtiger als Automatisierung

Ein zentrales Ergebnis: Nutzer wollen Einblick in Agent-Aktivitäten, aber kein Mikromanagement. Zu viel Kontrolle würde bedeuten, dass sie die Aufgaben gleich selbst erledigen könnten. Besonders wichtig ist den Probanden Transparenz bei unbekannten Bedienoberflächen. Dort wünschen sie mehr Zwischenschritte, Erklärungen und Bestätigungspausen – selbst bei Szenarien mit geringem Risiko. Bei Aktionen mit echten Konsequenzen wie Käufen, Kontoänderungen oder Kontaktaufnahmen mit anderen Menschen fordern Nutzer mehr Kontrolle.

Das Vertrauen in KI-Agenten bricht schnell zusammen, wenn das System stille Annahmen trifft oder Fehler macht. Bei mehrdeutigen Wahlmöglichkeiten bevorzugen Nutzer, dass der Agent pausiert und nachfragt, statt zufällig zu wählen. Besonders deutlich wird dies bei Entscheidungen, die zu falschen Produktauswahlen führen könnten.

Bestehende Systeme erfüllen Erwartungen nur teilweise

Die neun analysierten Systeme, darunter Claude Computer Use Tool von Anthropic, OpenAI Operator und Googles Project Mariner, erfüllen die Nutzererwartungen laut den Forschern nur teilweise. Die Studie zeigt auch kontextabhängige Erwartungen: Nutzer wollen unterschiedliches Agent-Verhalten, je nachdem ob sie Optionen erkunden oder eine bekannte Aufgabe ausführen. Die Erwartungen ändern sich auch basierend auf der Vertrautheit mit einer Schnittstelle. Die gesammelten Erkenntnisse könnten direkten Einfluss auf Apples geplante Siri-Überarbeitung haben. So kündigte der iPhone-Hersteller im Sommer 2024 an, dass der Sprachassistent künftig appübergreifend Aufgaben erledigen soll. Die Veröffentlichung verzögerte sich jedoch. Aktuell wird erst in den nächsten Monaten damit gerechnet.

Weiterlesen nach der Anzeige

Apple verfolgt bei KI-Agenten einen deutlich konservativeren Ansatz als Konkurrenten wie OpenAI, Google und Meta. Während diese Unternehmen Milliarden in große, allgemeine Sprachmodelle investieren, konzentriert sich Apple auf gezielte, datenschutzorientierte Features mit Schwerpunkt auf On-Device-Verarbeitung.

Für rechenintensive Aufgaben evaluiert Apple externe Modelle, insbesondere Googles Gemini, plant aber, eine angepasste Version auf eigenen Servern zu betreiben. Persönliche Daten und Geräte-Kontext bleiben bei Apples eigenen In-House-Modellen. Die aktuelle Studie spielt Apple in die Hände: Nutzer akzeptieren lieber später startende, aber besser konzipierte Systeme als schnell eingeführte Black-Box-Lösungen.

(mki)

Source link

Up Next

Android 17 bekommt Handoff-Funktion für geräteübergreifende Kontinuität

Nicht verpassen

Spotify-Co-CEO: Top-Entwickler schreiben dank KI keinen Code mehr

Entwicklung & Code

GitHub blendet Werbung in Pull Requests ein – Entwickler laufen Sturm

Weiterlesen nach der Anzeige

GitHub Copilot hat in Pull Requests ungefragt Produkthinweise eingebaut, die deutlich nach Werbung aussehen. Die vermeintlich freundlichen Tipps finden sich nicht nur in den Pull Requests, die Copilot erstellt hat, sondern auch in solchen, die der KI-Helfer nur bearbeitet hat. Nach Verwunderung und Protesten hat GitHub das Verhalten nun deaktiviert.

Fehlerkorrektur mit Werbebonus

Der Entwickler Zach Manson hat am 30. März einen Screenshot eines Pull Request veröffentlicht, bei dem Copilot Tippfehler korrigieren sollte und der nach der Korrektur einen zusätzlichen Hinweis enthielt: „Quickly spin up Copilot coding agent tasks from anywhere on your macOS or Windows machine with Raycast“. Das Wort Raycast hat Copilot freundlicherweise direkt mit einem Link zum Produktivitätstool versehen.

Screenshot von Copilot PR mit Produkthinweis — Der Entwickler Zach Manson hat einen Screenshot des erweiterten Pull Requests gepostet.

(Bild: Zach Manson)

Der Pull Request von Zach Manson war kein Einzelfall: Eine Suche auf GitHub zeigt denselben Hinweis in gut 11.000 Pull Requests.

Über 1,5 Millionen Pull Requests und auch GitLab betroffen

Weiterlesen nach der Anzeige

Offenbar hat Raycast die Werbung nicht einmal selbst beauftragt. Ein Artikel auf Neowin zeigt, dass sich im Markdown zum Pull Request der versteckte HTML-Kommentar „START COPILOT CODING AGENT TIPS“ findet.

Neowin hat ähnliche „Hinweise“ auf weitere Produkte in insgesamt 1,5 Millionen Pull Requests gefunden und den Raycast-Tipp nicht nur auf GitHub, sondern auch in mit Copilot bearbeiteten Merge Requests auf GitLab entdeckt. „Nützliche Hinweise“ gab es auch zu Integrationen für Slack und Microsoft Teams sowie zum Starten von Copilot-Aufgaben direkt aus Editoren wie VS Code, Visual Studio, JetBrains-IDEs und Eclipse.

Keine ungefragten Hinweise mehr

Inzwischen ist GitHub zurückgerudert. Auf Hacker News hat Tim Rogers aus dem Copilot-Coding-Agent-Team geschrieben, dass die Pull Requests nun keine Hinweise mehr enthalten. „Wir haben in den vom Copilot-Coding-Agent erstellten PRs Produkttipps eingefügt. Das Ziel war es, Entwicklern dabei zu helfen, neue Möglichkeiten für den Einsatz des Agenten in ihrem Arbeitsablauf zu entdecken. Doch angesichts des Feedbacks hier und nach reiflicher Überlegung war die Entscheidung falsch. Wir werden so etwas nicht wieder tun.“

Auf X hat Martin Woodward von GitHubs Developer-Relations-Team geschrieben, dass die Tipps ursprünglich für vollständig von Copilot erstellte Pull-Requests gedacht und da noch ganz in Ordnung waren, aber es wurde eklig, als Copilot sich in jeden PR einmischte, bei dem er mitmischte.

(rme)

Source link

Entwicklung & Code

Software Testing: TACON – Eine Praxis-Konferenz rund um Testautomatisierung

In dieser Episode sprechen Richard Seidl und André Köhler über die TACON, eine Konferenz mit klarem Fokus auf Testautomatisierung. Die beiden beleuchten, warum sie entstanden ist, was sie unterscheidet und wohin sie sich entwickelt. Praxisberichte aus Unternehmen, offene Einblicke in Stolpersteine und ein lernfreundliches Format prägen das Programm. Die familiäre Größe mit rund 130 Teilnehmenden und der feste Standort Leipzig schaffen Nähe, kurze Wege und abends tiefe Gespräche. Neue Elemente wie eine Gaming Area bringen Leichtigkeit.

Weiterlesen nach der Anzeige

André Köhler ist Gründer und Geschäftsführer von summit. Das Team von summit richtet zahlreiche Fachkonferenzen, Kongresse und Community Days rund um IT-Managementthemen aus. Dazu gehört auch die TACON (Test Automation Conference), die einmal jährlich stattfindet und interessierte Personen aus dieser Domäne zusammenbringt. Köhler ist darüber hinaus Professor für IT-Management an der IU Internationale Hochschule, wo er zu IT-Servicemanagement und IT-Projektmanagement lehrt und forscht.

Software-Testing im Gespräch

Bei diesem Format dreht sich alles um Softwarequalität: Ob Testautomatisierung, Qualität in agilen Projekten, Testdaten oder Testteams – Richard Seidl und seine Gäste schauen sich Dinge an, die mehr Qualität in die Softwareentwicklung bringen.

Die aktuelle Ausgabe ist auch auf Richard Seidls Blog verfügbar: „Eine Praxis-Konferenz rund um Testautomatisierung – André Köhler“.

(mai)

Source link

Entwicklung & Code

Super Productivity 18.0: Aufgaben automatisieren statt Handarbeit

Die Aufgabenverwaltung Super Productivity bringt in Version 18.0 ein regelbasiertes Automationssystem, konfigurierbare Issue-Provider, Deadline-Funktionen und Sicherheitsverbesserungen in der Electron-Basis. Das Open-Source-Projekt erscheint für Linux, macOS, Windows, Android und iOS.

Weiterlesen nach der Anzeige

Das neue Automatisierungssystem

Kern der neuen Version ist ein Automationssystem. Nutzer definieren Regeln, die bei bestimmten Auslösern automatisch Aktionen ausführen. Die Regeln unterstützen Titelabgleiche per Regex sowie eine Bedingung für Titelpräfixe („Titel beginnt mit“). Regex (Regular Expressions) sind musterbasierte Suchausdrücke, mit denen sich Titel präziser erfassen lassen als mit einfachen Textfiltern. Damit lassen sich typische Triage- oder Inbox-Abläufe automatisieren.

Die Anbindung an externe Systeme wie Jira, GitHub oder GitLab wird flexibler. Super Productivity erlaubt jetzt, das Polling-Intervall zu konfigurieren – also festzulegen, wie oft die App entfernte Dienste nach Änderungen abfragt. Importierte Vorgänge erhalten auf Wunsch automatisch Standard-Tags und Standard-Notizen. Neu sind außerdem eine Zwei-Wege-Feldsynchronisation und Erweiterungen unterstützen nun auch das Löschen entfernter Issues. Der Google-Calendar-Provider wird nun als mitgeliefertes Plugin eingebunden.

Aufgaben in der Task-Ansicht lassen sich jetzt nach Fälligkeit sortieren, gruppieren und filtern. Die Ansicht unterscheidet dabei Zeitfenster wie „heute“, „morgen“ oder „diese Woche“. Beim Ziehen einer Aufgabe in den Kalender zeigt eine Vorschau, wie lang der geplante Zeitblock wird. Unteraufgaben heben sich in Suchergebnissen visuell stärker ab.

Mobil: Wischgesten, besseres OAuth

Die Mobilversionen bekommen unter anderem ein Rechtswischen zum Abhaken, touchfreundlichere Kontextmenüs und vertikal begrenztes Drag-and-drop auf kleinen Displays. Android zeigt jetzt auch Erinnerungen aus der Hintergrundsynchronisation an.

Sicherheitsrelevant: Für Google-OAuth nutzt die App auf Mobilgeräten nun den Systembrowser statt einer eingebetteten WebView. Das entspricht der Empfehlung aus RFC 8252 für native Apps – ein externer Browser trennt Cookies und Seiteninhalt von der App. Google blockiert OAuth-Anfragen aus eingebetteten WebViews ohnehin.

Weiterlesen nach der Anzeige

Electron-Basis abgesichert

Auf dem Desktop aktiviert Super Productivity die webSecurity in Electron wieder und ergänzt einen Permission-Handler. Das ist kein kosmetischer Eingriff: Ohne webSecurity fällt die Same-Origin-Policy, und die App kann unsichere Inhalte domänenübergreifend ausführen. Electrons eigene Sicherheitsdokumentation warnt ausdrücklich davor, diese Einstellung in Produktionsanwendungen abzuschalten.

Das Preload-Skript wird nun mit esbuild gebündelt, was die Nutzung des Electron-Sandbox-Modus erleichtert. In sandboxierten Renderern gibt es keine vollständige Node.js-Umgebung; privilegierte Aufgaben laufen über IPC zum Hauptprozess. Preload-Skripte behalten dabei nur einen begrenzten Satz an Node- und Electron-APIs. Das verkleinert die Angriffsfläche.

Mehrere Sync-Fehler haben die Entwickler ebenfalls behoben: ein falscher „in sync“-Status bei Fehlern, der Verlust von Auth-Daten nach temporären Serverproblemen und Abstürze der Markdown-Synchronisation beim Anlegen von Unteraufgaben während einer Sync-Oszillation. Die Sync-Server-Bereitstellung validiert jetzt Caddyfile und Container.

Neues Theme, überarbeitetes Onboarding

Ferner bringt Version 18.0 ein minimalistisches Zen-Theme, ein überarbeitetes Onboarding mit Preset-Auswahl und lokalisierten Beispielaufgaben, klickbare Links in Aufgabentiteln, Tastenkürzel für Fett- und Kursivschrift in Kommentaren sowie ein größenverstellbares Always-on-top-Overlay. An Community-Plugins kommen eine Obsidian-Integration und ein StudyForge-Leaderboard hinzu.

Unter der Haube aktualisiert das Projekt Angular und Capacitor, behebt Speicherlecks und validiert die Formate von dueDay und deadlineDay beim Schreiben, um falsche Überfällig-Anzeigen zu verhindern. Der CSV-Export für Arbeitsprotokolle verarbeitet jetzt auch chinesische Zeichen korrekt.

Alle Informationen zu Super Productivity 18.0 finden sich in den Release Notes auf GitHub.

(fo)

Source link

Top 10: Die beste kabellose Überwachungskamera im Test – Akku, WLAN, LTE & Solar

Künstliche Intelligenzvor 1 Monat

Top 10: Die beste kabellose Überwachungskamera im Test – Akku, WLAN, LTE & Solar

Community Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast

Social Mediavor 4 Wochen

Community Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast

Community Management zwischen Reichweite und Verantwortung

Social Mediavor 2 Monaten

Community Management zwischen Reichweite und Verantwortung

Eindrucksvolle neue Identity für White Ribbon › PAGE online

UX/UI & Webdesignvor 2 Monaten

Eindrucksvolle neue Identity für White Ribbon › PAGE online

Aumovio: neue Displaykonzepte und Zentralrechner mit NXP‑Prozessor

Künstliche Intelligenzvor 3 Monaten

Aumovio: neue Displaykonzepte und Zentralrechner mit NXP‑Prozessor

eHealth: iOS‑App zeigt Störungen in der Telematikinfrastruktur

Künstliche Intelligenzvor 3 Monaten

eHealth: iOS‑App zeigt Störungen in der Telematikinfrastruktur

X3D² bestätigt: Der AMD Ryzen 9 9950X3D2 mit doppeltem 3D V-Cache kommt!

Apps & Mobile Entwicklungvor 3 Monaten

X3D² bestätigt: Der AMD Ryzen 9 9950X3D2 mit doppeltem 3D V-Cache kommt!

Community-Protest erfolgreich: Galera bleibt Open Source in MariaDB

Entwicklung & Codevor 3 Wochen

Community-Protest erfolgreich: Galera bleibt Open Source in MariaDB

Inspohub

Apple-Studie: Nutzer wollen transparente KI-Agenten statt Black-Box-Systeme

Entwicklung & Code

Apple-Studie: Nutzer wollen transparente KI-Agenten statt Black-Box-Systeme

Transparenz wichtiger als Automatisierung

Bestehende Systeme erfüllen Erwartungen nur teilweise

Entwicklung & Code

GitHub blendet Werbung in Pull Requests ein – Entwickler laufen Sturm

Fehlerkorrektur mit Werbebonus

Über 1,5 Millionen Pull Requests und auch GitLab betroffen

Keine ungefragten Hinweise mehr

Entwicklung & Code

Software Testing: TACON – Eine Praxis-Konferenz rund um Testautomatisierung

Software-Testing im Gespräch

Entwicklung & Code

Super Productivity 18.0: Aufgaben automatisieren statt Handarbeit

Das neue Automatisierungssystem

Mobil: Wischgesten, besseres OAuth

Electron-Basis abgesichert

Neues Theme, überarbeitetes Onboarding

c’t-Workshop: Kubernetes im Blick: Observability mit Grafana LGTM meistern

Das US-Routerverbot und seine durchsichtige Begründung

Model Council und Critique: Microsofts Multi-Model-KI-Tools

Top 10: Die beste kabellose Überwachungskamera im Test – Akku, WLAN, LTE & Solar

Community Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast

Community Management zwischen Reichweite und Verantwortung

Beliebt

Inspohub

Apple-Studie: Nutzer wollen transparente KI-Agenten statt Black-Box-Systeme

Transparenz wichtiger als Automatisierung

Bestehende Systeme erfüllen Erwartungen nur teilweise

Das könnte Ihnen gefallen

Entwicklung & Code

GitHub blendet Werbung in Pull Requests ein – Entwickler laufen Sturm

Fehlerkorrektur mit Werbebonus

Über 1,5 Millionen Pull Requests und auch GitLab betroffen

Keine ungefragten Hinweise mehr

Entwicklung & Code

Software Testing: TACON – Eine Praxis-Konferenz rund um Testautomatisierung

Software-Testing im Gespräch

Entwicklung & Code

Super Productivity 18.0: Aufgaben automatisieren statt Handarbeit

Das neue Automatisierungssystem

Mobil: Wischgesten, besseres OAuth

Electron-Basis abgesichert

Neues Theme, überarbeitetes Onboarding

c’t-Workshop: Kubernetes im Blick: Observability mit Grafana LGTM meistern

Das US-Routerverbot und seine durchsichtige Begründung

Model Council und Critique: Microsofts Multi-Model-KI-Tools

Top 10: Die beste kabellose Überwachungskamera im Test – Akku, WLAN, LTE & Solar

Community Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast

Community Management zwischen Reichweite und Verantwortung

Beliebt