Entwicklung & Code

Open Responses: Einheitliche LLM-Schnittstelle statt Adapter-Chaos

Mit Open Responses ist ein Open-Source-Standard für eine herstellerunabhängige JSON-API erschienen, über die Sprachmodelle mit Clients kommunizieren. Sie basiert auf Responses API und stellt einen weiteren Baustein des agentischen KI-Ökosystems der Firma dar.

Weiterlesen nach der Anzeige

Zusammen mit der Responses API hatte OpenAI letztes Jahr integrierte Tools und ein Software Development Kit (ADK) vorgestellt, mit deren Hilfe sich eigene KI-Agenten erstellen lassen. Die Responses API kombiniert die Chat Completions API sowie die Assistent API von OpenAI und kann eigenständig agieren, statt sich auf das Liefern von Antworten zu beschränken. Bislang war für jedes LLM jedoch ein eigener Client-Adapter erforderlich. Dies soll Open Responses nun vereinheitlichen.

OpenAI will den offenen Standard in den kommenden Monaten zusammen mit der Community und Anbietern von Interferenzlösungen weiterentwickeln. Dazu konnte OpenAI Hugging Face, Nvidia, LLM, LM Studio, Ollama, OpenRouter und Vercel als Launch-Partner gewinnen.

Mozilla hat mit any-llm bereits ein ähnliches Projekt am Start. Das Python-Paket ist eine einheitliche API für viele LLMs und erspart es Entwicklerinnen und Entwicklern, für jedes einzelne LLM einen eigenen Adapter pflegen zu müssen.

Einfacher Umstieg von Responses API auf Open Responses

Um die KI-Interoperabilität zu verbessern, definiert Open Responses ein „gemeinsames Schema und eine Werkzeugschicht, um den Aufruf von Sprachmodellen, das Streaming von Ergebnissen und die Zusammenstellung agentenbasierter Workflows zu vereinheitlichen“. Das soll unabhängig vom Anbieter funktionieren.

Entwicklerinnen und Entwickler, die bereits die Responses API nutzen, können laut OpenAI ohne großen Aufwand auf das neue Format umsteigen. Die Änderungen sollen größtenteils die agentische Argumentation betreffen. Dafür stehen neben encrypted_content (anbieterspezifische geschützte Inhalte) und summary (aus den Reasoning Traces bereinigte Daten) und dem neuen content (Reasoning Traces) nun drei Eingabeparameter zur Verfügung. Letzterer erlaubt es, die Reasoning Traces über die API zugänglich zu machen, was einen Anbieterwechsel leichter macht.

Weiterlesen nach der Anzeige

Im Fall des KI-Delta Learnings sehen die Funktionsaufrufe für Open Response im Vergleich zu Responses API folgendermaßen aus:

// Open weight models stream raw reasoning
event: response.reasoning.delta
data: { "delta": "User asked: 'Where should I eat...' Step 1: Parse location...", ... }

// Models with encrypted reasoning send summaries, or sent as a convenience by Open Weight models
event: response.reasoning_summary_text.delta
data: { "delta": "Determined user wants restaurant recommendations", ... }

Wer sich genauer in das agentische Open-Source-Modell einlesen will, findet auf der dessen Webseite eine technische Beschreibung.

(who)

Source link

Verwandte Themen:AdapterChaos einheitliche IT künstliche Künstliche Intelligenz LLMSchnittstelle open Open Responses open source OpenAI Responses statt

Up Next

Anthropic überarbeitet Verhaltensrichtlinien für KI-Modell Claude

Nicht verpassen

software-architektur.tv: Wie Datenbanken die Architektur formen

Entwicklung & Code

KI-Agenten unter sich: Meta schluckt Moltbook-Plattform

Meta hat sich den Reddit-Klon der KI-Agenten einverleibt: Die Plattform Moltbook erregte vor einigen Wochen Aufsehen als Treffpunkt für KI-Agenten. Verschiedene Computer, auf denen die KI-Software OpenClaw installiert war, tauschten sich in dem Forum offenbar über ihre menschlichen Besitzer und ihre Erfahrungen aus. Jetzt hat Meta mit dem Portal auch die Gründer Matt Schlicht und Ben Parr angeheuert und will sie künftig in seinen Meta Superintelligence Labs (MSL) beschäftigen. Den Kaufpreis hat das Unternehmen nicht bekanntgegeben.

Weiterlesen nach der Anzeige

Was genau Meta sich von der Übernahme von Moltbook verspricht, ist unklar. Meta-CTO Andrew Bosworth sagte noch im Februar während einer Fragestunde auf Instagram, dass er es nicht besonders interessant finde, wenn auf Moltbook KI-Agenten menschenähnlich schreiben. Schließlich seien sie auf menschlichen Daten trainiert.

Moltbook sorgte primär dafür, dass OpenClaw einer breiteren Öffentlichkeit bekannt wurde. Die eigentliche KI-Leistung ging aber von OpenClaw aus. Der Wrapper für KI-Modelle, der es ermöglicht, KI-Agenten über populäre Chat-Apps wie iMessage, Discord, Slack oder WhatsApp in natürlicher Sprache anzusprechen, war zuvor vor allem in der Tech-Community bekannt. OpenClaw-Erfinder Peter Steinberger wurde übrigens auch von der KI-Industrie übernommen – er schloss sich OpenAI an.

Per Vibecoding entstanden

Beide Projekte – Moltbook und OpenClaw – haben gemeinsam, dass sie per Vibecoding entstanden sind. Die jeweiligen Entwickler haben dabei natürlichsprachliche Prompts eingesetzt, um von KI-Modellen Code generieren zu lassen – klassisches Programmierhandwerk war kaum gefragt.

Hinzu kommt, dass schnell Zweifel an der Authentizität der Beiträge auf Moltbook aufkamen. Sicherheitsforscher fanden heraus, dass es recht einfach möglich war, Tokens aus einer ungesicherten öffentlichen Datenbank zu laden, um sich damit als beliebiger Agent auszugeben. Für Furore sorgte etwa ein Post, der scheinbar zeigte, wie ein KI-Agent andere dazu anstiftete, eine geheime Sprache zu entwickeln, um sich ohne Wissen der Menschen zu organisieren. Dahinter steckte jedoch in Wirklichkeit ein Mensch.

Lesen Sie auch

(mki)

Source link

Entwicklung & Code

KI-Agenten werden am Arbeitsmarkt vorbei entwickelt

Die Entwicklung von KI-Agenten konzentriert sich stark auf Programmieraufgaben und bildet die Anforderungen des realen Arbeitsmarkts nur unzureichend ab. Das ist das zentrale Ergebnis einer Studie von Forschenden der Stanford University und der Carnegie Mellon University.

Weiterlesen nach der Anzeige

Das Team um Zora Z. Wang hat für die auf arXiv veröffentlichte Untersuchung 43 gängige Benchmarks mit insgesamt 72.342 Aufgaben analysiert und diese auf 1.016 Berufe des US-Arbeitsmarkts abgebildet. Die Berufe stammen aus der Berufstaxonomie O*NET der US-Regierung, die berufliche Tätigkeiten unter anderem nach dem Arbeitsfeld und den verlangten Fähigkeiten klassifiziert.

Einseitige Tests

Das Ergebnis ist ernüchternd: Die Benchmarks testen KI-Agenten ganz überwiegend im Arbeitsfeld „Computer and Mathematical“ – eine Berufskategorie, die nur 7,6 Prozent der US-Beschäftigung ausmacht. Die Anforderungen hoch digitalisierter und wirtschaftlich bedeutender Felder wie Management, Recht, Architektur und Ingenieurwesen werden hingegen kaum abgedeckt.

Bei den getesteten Fähigkeiten zeigt sich ein vergleichbares Muster: Enge Aktivitäten wie „Getting Information“ und „Working with Computers“ sind überrepräsentiert, obwohl sie nur einen kleinen Teil der Beschäftigung ausmachen. Die für viele Berufe zentrale Kategorie „Interacting with Others“ fehlt in den Benchmarks fast vollständig.

Insgesamt decken die 43 untersuchten Benchmarks 56,5 Prozent der Arbeitsfeld-Taxonomie und 85,4 Prozent der Fähigkeiten-Taxonomie ab. Am breitesten aufgestellt ist der Benchmark GDPval mit 47,8 Prozent Domänen- und 58,5 Prozent Fähigkeiten-Abdeckung.

Agenten scheitern an komplexen Aufgaben

Die Analyse zeigt auch, dass KI-Agenten bei steigender Aufgabenkomplexität deutlich an ihre Grenzen stoßen – besonders bei Aufgaben aus den Kategorien Informationsverarbeitung und zwischenmenschliche Interaktion. Das steht in Einklang mit anderen aktuellen Ergebnissen: Der Benchmark LiveAgentBench etwa ergab, dass Agenten mit Werkzeugzugriff nur 24 Prozent von 104 praxisnahen Aufgaben lösen konnten, während Menschen auf 69 Prozent kamen.

Weiterlesen nach der Anzeige

Die Forschenden leiten aus ihren Ergebnissen drei Prinzipien für künftige Benchmarks ab: Diese sollten eine breitere Abdeckung realer Berufsdomänen und Fähigkeiten bieten, realistischere und komplexere Aufgabenstellungen umfassen und feingranulare Bewertungskriterien nutzen. Ohne eine solche Neuausrichtung bestehe das Risiko, dass die KI-Agenten-Entwicklung an den wirtschaftlich und gesellschaftlich relevanten Einsatzgebieten vorbeiläuft.

(odi)

Source link

Entwicklung & Code

Bericht: KI-Coding-Tools verursachten Ausfälle bei Amazon

Der Gebrauch von KI-Coding-Tools soll bei Amazon zu Ausfällen seiner E-Commerce-Plattform geführt haben. Laut einem Bericht wurde deshalb ein bislang freiwilliges wöchentliches Meeting umgewidmet, an dem alle beteiligten Entwickler teilnehmen müssen. Ein erstes Ergebnis: Künftig sollen KI-assistierte Code-Änderungen nur noch nach Prüfung durch erfahrene Kräfte freigegeben werden.

Weiterlesen nach der Anzeige

Anfang März soll es zu knapp sechsstündigen Ausfällen auf Amazon.com und in der Shopping-App gekommen sein. Kunden konnten dem Bericht zufolge keine Käufe tätigen, ihre Daten oder Preise abrufen. Als Ursache wurde offiziell eine fehlerhafte Software-Aktualisierung genannt.

Einzelne Fehler mit weitreichenden Folgen

Internen Unterlagen zufolge hätten KI-generierte Änderungen die Probleme ausgelöst, berichtet die Financial Times unter Berufung auf nicht genannte Quellen im Unternehmen. Es fehlten Best Practices und Sicherheitsmechanismen für den Gebrauch der generativen KI. Einzelne Fehler hätten deshalb zu weitreichenden Folgeschäden geführt. Bereits vor knapp anderthalb Jahren war öffentlich geworden, dass Amazon von Softwareentwicklern inzwischen erwartet, dass sie KI für viele Programmieraufgaben verwenden.

Neben der Einkaufsseite soll auch Amazons Cloud-Sparte AWS in mindestens zwei Fällen Probleme durch KI-Coding-Assistenten verzeichnet haben. Im Dezember etwa habe das Amazon-eigene KI-Tool „Kiro“ eigenständig eine Produktionsumgebung gelöscht und sie neu erstellt. Folge sei ein 13-stündiger Ausfall eines Kostenkalkulators für AWS-Kunden gewesen. Amazon selbst habe nur von einem sehr kleinen Problem gesprochen, das nur einen einzelnen Dienst in Teilen Chinas betraf.

Intern soll es Diskussionen geben, ob nicht auch der Stellenabbau bei Amazon in die Probleme hineinwirkt. Amazon hatte sich von 16.000 Mitarbeitern getrennt. Seither sei die Zahl kritischer Probleme gestiegen, berichten Entwickler laut der FT. Amazon selbst bestreitet einen Zusammenhang. Auch die ergriffenen Maßnahmen seien „normaler Geschäftsbetrieb“ und Teil kontinuierlicher Verbesserungen.

(mki)

Source link

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Künstliche Intelligenzvor 2 Monaten

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Community Management zwischen Reichweite und Verantwortung

Social Mediavor 4 Wochen

Community Management zwischen Reichweite und Verantwortung

Community Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast

Social Mediavor 1 Woche

Community Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast

Top 10: Die beste kabellose Überwachungskamera im Test – Akku, WLAN, LTE & Solar

Künstliche Intelligenzvor 3 Wochen

Top 10: Die beste kabellose Überwachungskamera im Test – Akku, WLAN, LTE & Solar

Kommentar: Anthropic verschenkt MCP – mit fragwürdigen Hintertüren

Entwicklung & Codevor 3 Monaten

Kommentar: Anthropic verschenkt MCP – mit fragwürdigen Hintertüren

Digital Health: „Den meisten ist nicht klar, wie existenziell IT‑Sicherheit ist“

Künstliche Intelligenzvor 3 Monaten

Digital Health: „Den meisten ist nicht klar, wie existenziell IT‑Sicherheit ist“

Die meistgehörten Gastfolgen 2025 im Feed & Fudder Podcast – Social Media, Recruiting und Karriere-Insights

Social Mediavor 3 Monaten

Die meistgehörten Gastfolgen 2025 im Feed & Fudder Podcast – Social Media, Recruiting und Karriere-Insights

Eindrucksvolle neue Identity für White Ribbon › PAGE online

UX/UI & Webdesignvor 1 Monat

Eindrucksvolle neue Identity für White Ribbon › PAGE online

Inspohub

Open Responses: Einheitliche LLM-Schnittstelle statt Adapter-Chaos

Entwicklung & Code

Open Responses: Einheitliche LLM-Schnittstelle statt Adapter-Chaos

Einfacher Umstieg von Responses API auf Open Responses

Entwicklung & Code

KI-Agenten unter sich: Meta schluckt Moltbook-Plattform

Per Vibecoding entstanden

Lesen Sie auch

Entwicklung & Code

KI-Agenten werden am Arbeitsmarkt vorbei entwickelt

Einseitige Tests

Agenten scheitern an komplexen Aufgaben

Entwicklung & Code

Bericht: KI-Coding-Tools verursachten Ausfälle bei Amazon

Einzelne Fehler mit weitreichenden Folgen

FreeBSD 14.4 läuft deutlich besser in der Cloud und auf Notebooks

Diese neue elektrische Zahnbürste stellt Oral-B und Philips in den Schatten

Vorstellung Mercedes VLE und VLS: Ausweichen nach oben

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Community Management zwischen Reichweite und Verantwortung

Community Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast

Beliebt

Inspohub

Open Responses: Einheitliche LLM-Schnittstelle statt Adapter-Chaos

Einfacher Umstieg von Responses API auf Open Responses

Das könnte Ihnen gefallen

Entwicklung & Code

KI-Agenten unter sich: Meta schluckt Moltbook-Plattform

Per Vibecoding entstanden

Entwicklung & Code

KI-Agenten werden am Arbeitsmarkt vorbei entwickelt

Einseitige Tests

Agenten scheitern an komplexen Aufgaben

Entwicklung & Code

Bericht: KI-Coding-Tools verursachten Ausfälle bei Amazon

Einzelne Fehler mit weitreichenden Folgen

FreeBSD 14.4 läuft deutlich besser in der Cloud und auf Notebooks

Diese neue elektrische Zahnbürste stellt Oral-B und Philips in den Schatten

Vorstellung Mercedes VLE und VLS: Ausweichen nach oben

Schnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt

Community Management zwischen Reichweite und Verantwortung

Community Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast

Beliebt