Entwicklung & Code
OpenAI Realtime API bietet günstigeres Mini-Modell für Echtzeitkommunikation
Knapp ein Jahr nach der Vorstellung der Developer Preview hat OpenAI im August 2025 die GA-Version (General Availability) der Realtime API veröffentlicht. Die Realtime API ist eine multimodale Schnittstelle, über die Audio- und Textdaten mit sehr geringer Latenz direkt mit einem Sprachmodell ausgetauscht werden können. Der Developer Day im Oktober 2025, einige Monate nach dem GA-Launch, brachte zusätzliche Neuerungen, darunter neue Tools, Preisänderungen und eine kleinere, schnellere Modellvariante.
Weiterlesen nach der Anzeige

Marius Obert baut gerne Prototypen mit den neuesten Cloud-Technologien und spricht noch lieber darüber. Seine Karriere startete in der UI-Entwicklung im sonnigen Kalifornien. Während dieser Zeit lernte er Webtechnologien wie JavaScript im Allgemeinen und das gesamte Node.js-Ökosystem im Speziellen zu lieben.
Mit der GA-Version erweitert OpenAI die Möglichkeiten der Interaktion mit KI-Agenten deutlich. In einem Blogbeitrag stellt das Unternehmen Anwendungsbeispiele von Partnern wie Zillow, T-Mobile, StubHub, Oscar Health und Lemonade vor, die die Vielfalt der Einsatzszenarien verdeutlichen. Die Anwendungsfelder reichen über klassische Sprachdialoge hinaus und ermöglichen sogenannte „hands-free Interaktionen“, bei denen Anwenderinnen und Anwender Text-, Sprach- und visuelle Eingaben flexibel kombinieren können. Die Realtime API ist dabei nicht ausschließlich als Voice-to-Voice-Lösung konzipiert, sondern als multimodales System, das Text, Audio und Bilder gleichermaßen als Eingaben akzeptiert. Sprachinteraktion stellt somit einen ergänzenden Kommunikationskanal neben weiteren Nutzungsformen dar.
Anwendungen werden zunehmend interaktiver und Nutzer erwarten ein unmittelbares, natürliches Reaktionsverhalten. Die Realtime API erfüllt diesen Bedarf, indem sie eine kontinuierliche, bidirektionale Kommunikation mit sehr geringer Latenz ermöglicht – etwa für Sprachassistenz im Kundensupport, automatische Protokollführer im Büro oder Anwendungen, die Live-Visualisierungen und Sprache kombinieren.
Durch den Wegfall traditioneller Zwischenschritte wie separater Speech-to-Text- und Text-to-Speech-Prozesse entsteht ein direktes Modell, das Sprache versteht und beantwortet, ohne spürbare Verzögerung oder Verlust von Nuancen.
Technische Neuerungen im allgemeinen Release
Im Vergleich zur Developer Preview enthält die GA-Version der Realtime API zahlreiche technische Erweiterungen und Verbesserungen in den Bereichen Modellarchitektur, Integration und Nutzbarkeit. Eine zentrale Änderung ist die Einführung einer Mini-Variante des Modells, die kosteneffizientere und schnellere Anwendungen ermöglicht. Die OpenAI-Website zeigt die Unterschiede zwischen gpt-realtime und gpt-realtime-mini.

Wann ist Voice AI in Webanwendungen sinnvoll, und wann nicht? Marius Oberts Vortrag auf dem Online-Thementag enterJS Integrate AI am 28. April 2026. Frühbuchertickets und Gruppenrabatte im Online-Ticketshop.
Die Audioqualität wurde deutlich überarbeitet: Die erzeugte Sprache klingt natürlicher und ausdrucksstärker, mit feineren Betonungen, flüssigeren Pausen und einer besseren Anpassung an Gesprächsverläufe. OpenAI hat hierfür zwei neue Stimmen eingeführt: „Cedar“ und „Marin“.
Weiterlesen nach der Anzeige
Auch die Fähigkeit zur Befolgung komplexer Anweisungen hat der Anbieter verbessert. Das Modell reagiert präziser auf System- und Entwickler-Prompts, und es kann Texte exakt vorlesen, alphanumerische Sequenzen korrekt wiedergeben und fließend zwischen Sprachen wechseln. Benchmark-Tests wie die Big Bench Audio Evaluation weisen eine Steigerung der Genauigkeit (Accuracy) von rund 65 Prozent in der Beta-Version auf über 82 Prozent in der GA-Version aus:

OpenAI Realtime API: Ergebnisse des Benchmarks Big Bench Audio Intelligence
(Bild: OpenAI)
Eine wesentliche Verbesserung betrifft die erweiterten rhetorischen Fähigkeiten des Modells. Die Realtime API kann Gesprächsverläufe nun flüssiger, natürlicher und kontextbewusster gestalten, indem sie Pausen, Betonungen und Gesprächsdynamik besser interpretiert. In diesem Zusammenhang führt OpenAI die Funktion der Conversation Idle Timeouts ein. Erkennt das Modell über einen definierten Zeitraum keine Eingabe, kann es automatisch Folgesätze wie „Sind Sie noch da?“ ausgeben, um den Gesprächsfluss aufrechtzuerhalten und dem Nutzer oder der Nutzerin ein aktives Gespräch zu signalisieren.
Darüber hinaus reagiert das Modell während längerer oder asynchroner Funktionsaufrufe mit Zwischentexten, beispielsweise „Ich warte noch auf das Ergebnis“, um Wartezeiten kommunikativ zu überbrücken und den Dialog lebendig zu halten. Diese Ergänzungen tragen dazu bei, die Interaktion natürlicher und konsistenter zu gestalten – insbesondere in Anwendungsfällen, in denen Echtzeit-Feedback und gesprochene Zwischenausgaben entscheidend für die Nutzererfahrung sind.
Zudem unterstützt die OpenAI Realtime API nun neben WebSocket und WebRTC auch das Session Initiation Protocol (SIP), was die direkte Integration in Telefonie- und Contact-Center-Systeme erleichtert.
Für Entwicklerinnen und Entwickler hat der Anbieter die Strukturen der Ereignis- („Event“-) und Nachrichten-Items überarbeitet, um Debugging und Fehlerbehandlung zu vereinfachen. Dieses Modell verfügt zudem inzwischen über EU-Datenresidenz, um europäischen Datenschutzanforderungen Rechnung zu tragen.
Vorgefertigte Werkzeuge wie Web-Search oder Code Interpreter sind derzeit noch nicht integriert, sodass Anwender sie selbst nachbauen müssen. Über die Implementierung des MCP-Servers (Model Context Protocol) ist es möglich, externe Tools in die Agentenlogik einzubinden. Damit lassen sich die Fähigkeiten eines Agenten relativ einfach erweitern und in bestehende Tools größerer Anwendungen integrieren. Diese Änderungen erhöhen insgesamt die Robustheit, Flexibilität und Praxistauglichkeit der API.
Modellübersicht
Die folgende Tabelle gibt einen Überblick über die wichtigsten Modellparameter und Preisstrukturen von gpt-realtime und gpt-realtime-mini.
| 32.000 | 4.096 | Okt. 2023 | Text, Bild, Audio | Text, Audio | $ 32,00 (Cached: $ 0,40) | $ 64,00 |
| 32.000 | 4.096 | Okt. 2023 | Text, Bild, Audio | Text, Audio | $ 10,00 (Cached: $ 0,30) | $ 20,00 |
Tabelle 1: Vergleich der Kernparameter beider Modelle; Kosten pro Million Token in US-Dollar ($)
Entwicklung & Code
Super Productivity 18.0: Aufgaben automatisieren statt Handarbeit
Die Aufgabenverwaltung Super Productivity bringt in Version 18.0 ein regelbasiertes Automationssystem, konfigurierbare Issue-Provider, Deadline-Funktionen und Sicherheitsverbesserungen in der Electron-Basis. Das Open-Source-Projekt erscheint für Linux, macOS, Windows, Android und iOS.
Weiterlesen nach der Anzeige
Das neue Automatisierungssystem
Kern der neuen Version ist ein Automationssystem. Nutzer definieren Regeln, die bei bestimmten Auslösern automatisch Aktionen ausführen. Die Regeln unterstützen Titelabgleiche per Regex sowie eine Bedingung für Titelpräfixe („Titel beginnt mit“). Regex (Regular Expressions) sind musterbasierte Suchausdrücke, mit denen sich Titel präziser erfassen lassen als mit einfachen Textfiltern. Damit lassen sich typische Triage- oder Inbox-Abläufe automatisieren.
Die Anbindung an externe Systeme wie Jira, GitHub oder GitLab wird flexibler. Super Productivity erlaubt jetzt, das Polling-Intervall zu konfigurieren – also festzulegen, wie oft die App entfernte Dienste nach Änderungen abfragt. Importierte Vorgänge erhalten auf Wunsch automatisch Standard-Tags und Standard-Notizen. Neu sind außerdem eine Zwei-Wege-Feldsynchronisation und Erweiterungen unterstützen nun auch das Löschen entfernter Issues. Der Google-Calendar-Provider wird nun als mitgeliefertes Plugin eingebunden.
Aufgaben in der Task-Ansicht lassen sich jetzt nach Fälligkeit sortieren, gruppieren und filtern. Die Ansicht unterscheidet dabei Zeitfenster wie „heute“, „morgen“ oder „diese Woche“. Beim Ziehen einer Aufgabe in den Kalender zeigt eine Vorschau, wie lang der geplante Zeitblock wird. Unteraufgaben heben sich in Suchergebnissen visuell stärker ab.
Mobil: Wischgesten, besseres OAuth
Die Mobilversionen bekommen unter anderem ein Rechtswischen zum Abhaken, touchfreundlichere Kontextmenüs und vertikal begrenztes Drag-and-drop auf kleinen Displays. Android zeigt jetzt auch Erinnerungen aus der Hintergrundsynchronisation an.
Sicherheitsrelevant: Für Google-OAuth nutzt die App auf Mobilgeräten nun den Systembrowser statt einer eingebetteten WebView. Das entspricht der Empfehlung aus RFC 8252 für native Apps – ein externer Browser trennt Cookies und Seiteninhalt von der App. Google blockiert OAuth-Anfragen aus eingebetteten WebViews ohnehin.
Weiterlesen nach der Anzeige
Electron-Basis abgesichert
Auf dem Desktop aktiviert Super Productivity die webSecurity in Electron wieder und ergänzt einen Permission-Handler. Das ist kein kosmetischer Eingriff: Ohne webSecurity fällt die Same-Origin-Policy, und die App kann unsichere Inhalte domänenübergreifend ausführen. Electrons eigene Sicherheitsdokumentation warnt ausdrücklich davor, diese Einstellung in Produktionsanwendungen abzuschalten.
Das Preload-Skript wird nun mit esbuild gebündelt, was die Nutzung des Electron-Sandbox-Modus erleichtert. In sandboxierten Renderern gibt es keine vollständige Node.js-Umgebung; privilegierte Aufgaben laufen über IPC zum Hauptprozess. Preload-Skripte behalten dabei nur einen begrenzten Satz an Node- und Electron-APIs. Das verkleinert die Angriffsfläche.
Mehrere Sync-Fehler haben die Entwickler ebenfalls behoben: ein falscher „in sync“-Status bei Fehlern, der Verlust von Auth-Daten nach temporären Serverproblemen und Abstürze der Markdown-Synchronisation beim Anlegen von Unteraufgaben während einer Sync-Oszillation. Die Sync-Server-Bereitstellung validiert jetzt Caddyfile und Container.
Neues Theme, überarbeitetes Onboarding
Ferner bringt Version 18.0 ein minimalistisches Zen-Theme, ein überarbeitetes Onboarding mit Preset-Auswahl und lokalisierten Beispielaufgaben, klickbare Links in Aufgabentiteln, Tastenkürzel für Fett- und Kursivschrift in Kommentaren sowie ein größenverstellbares Always-on-top-Overlay. An Community-Plugins kommen eine Obsidian-Integration und ein StudyForge-Leaderboard hinzu.
Unter der Haube aktualisiert das Projekt Angular und Capacitor, behebt Speicherlecks und validiert die Formate von dueDay und deadlineDay beim Schreiben, um falsche Überfällig-Anzeigen zu verhindern. Der CSV-Export für Arbeitsprotokolle verarbeitet jetzt auch chinesische Zeichen korrekt.
Alle Informationen zu Super Productivity 18.0 finden sich in den Release Notes auf GitHub.
(fo)
Entwicklung & Code
Eclipse Theia: Community-Release 2026-02 integriert GitHub Copilot
EclipseSource hat verkündet, dass das neue Community-Release 2026-02 für Eclipse Theia fertig ist. Die Community-Releases der Plattform zum Erstellen von integrierten Entwicklungsumgebungen (IDEs) und Tools für das Web und den Desktop erscheinen vierteljährlich.
Weiterlesen nach der Anzeige
Sie legen im Gegensatz zu den meist monatlich erscheinenden regulären Releases den Fokus stärker auf Stabilität und Kompatibilität. In der neuen Version finden Entwicklerinnen und Entwickler Features aus den Theia-Versionen 1.67 und 1.68, die sich unter anderem um künstliche Intelligenz drehen.
Rund um KI: GitHub-Copilot-Integration und Agent Skills
Das neue Community-Release bietet eine GitHub-Copilot-Integration sowohl für die Theia IDE als auch für alle mit Theia AI gebauten Tools. Wer bereits ein bestehendes GitHub-Copilot-Abo besitzt, kann dieses direkt ohne zusätzliche API-Keys oder Abos einsetzen. Dieses Feature stammt aus Eclipse Theia 1.68, ebenso wie Agent Skills. Diese befinden sich noch im Alpha-Status und ermöglichen es, Agenten mit wiederverwendbaren Anweisungen und Domänenwissen zu versorgen.
(Bild: TechSolution/Adobe Stock)

Der betterCode() GenAI Summit zeigt am 11. Juni, welche KI-Tools für welche Aufgaben geeignet sind und wie die KI-Integration effizient funktioniert. Außerdem thematisiert er die Auswirkungen der KI-gestützten Softwareentwicklung auf die Security und die Arbeit von Entwicklungsteams.
Terminal Manager vereint mehrere Terminals
Der seit Eclipse Theia 1.67 verfügbare Terminal Manager hat nun auch in das Community-Release Einzug gehalten. Er erlaubt das Verwalten mehrerer Terminals aus einer einzigen Ansicht heraus, mit vertikaler und horizontaler Teilung, Tree-basierter Navigation sowie den Möglichkeiten der Terminal-Umbenennung und ihrer Anordnung per Drag & Drop. Der Terminal Manager lässt sich mit dem Setzen der Einstellung terminal.grouping.mode auf tree aktivieren.

Der Terminal Manager in Eclipse Theia zeigt mehrere Terminals an.
(Bild: EclipseSource)
Alle Neuerungen im Community-Release 2026-02 für Eclipse Theia führt der EclipseSource-Blog auf.
Weiterlesen nach der Anzeige
Lesen Sie auch
(mai)
Entwicklung & Code
KubeCon EU 2026: Kubernetes wird erwachsen – BSD, eBPF und mTLS
Vom 24. bis 26. März 2026 war Amsterdam zum zweiten Mal das Zentrum des (europäischen) Cloud-Native-Universums. Über 13.000 Teilnehmende hatten sich nach offizieller Verlautbarung der CNCF auf den Weg zur KubeCon EU in die niederländische Metropole gemacht, um die neuesten Infos von Kubernetes und Co. zu erfahren. Der erste Tag war – wenig überraschend – dem Thema KI gewidmet.
Weiterlesen nach der Anzeige
Im Frühjahr 2026 kann man keine Open-Source-Konferenz in Europa ausrichten, ohne das Thema (Daten-)Souveränität deutlich anzusprechen. In diesem Punkt hat die KubeCon EU jedoch Potenzial verspielt. Es gab im Vorfeld lediglich eine kleine Satelliten-Veranstaltung zu dem Thema. Zwar stellten europäische Kubernetes-Anwender wie der IT-Dienstleister der Bundeswehr BWI oder die französische Eisenbahngesellschaft SNCF ihre Cloud-Native-Reise auf der großen Hauptbühne vor, es bleibt aber der Eindruck einer eher stiefmütterlichen Behandlung des Themas zurück. Die Thesen: „Global zusammenarbeiten und lokal installieren“ und „You can always fork“ sind nur bedingt hilfreich.

Die auf Developer Experience (DX) und Platform Engineering spezialisierte CLC-Konferenz findet vom 11. bis 12. November 2026 in Mannheim statt. Beim Call for Proposals werden bis zum 21. April Vorschläge für Workshops und Talks gesucht – vor allem Praxisberichte.
Weitere Informationen finden sich auf derCLC-Website.
Neue Laufzeiten und Plattformen: Lima, urunc und die BSD-Welt
Obwohl Kubernetes bereits 12 Jahre existiert und sich zu einem Standard gemausert hat, sind noch wichtige Arbeiten an fundamentalen Bauteilen notwendig. Technisch ist die Container-Orchestrierung zu weiten Teilen mit Linux verknüpft. Das betrifft sowohl die darunterliegende Infrastruktur als auch die Applikationen in den Containern. Bei Letzteren gibt es gute Neuigkeiten für die BSD-Freunde und auch für macOS-Anwender: das Projekt Lima (Linux Machines). Dieses ist schon seit 2022 Teil der CNCF-Familie. Das ursprüngliche Ziel war eine bessere Unterstützung von Containern auf macOS-Rechnern. Inzwischen ist es unter anderem auch für Linux verfügbar und fokussiert sich auf leichtgewichtige virtuelle Maschinen.
Im Vorfeld der KubeCon EU 2026 ist Version 2.1 des Projekts erschienen, die nun auch macOS und FreeBSD als Gäste unterstützt. Das Feature ist allerdings noch im experimentellen Stadium. Anwender können mit Lima leichtgewichtige virtuelle Maschinen nutzen – vergleichbar mit Containern. Letztere und auch Kubernetes-Pods lassen sich ebenfalls mit Lima verwalten. In der Dokumentation finden sich Beispiele für K3s, k0s und RKE2. Alternativ gibt es aber noch weitere Projekte wie KubeVirt, die ebenfalls virtuelle Maschinen und Container gleichwertig behandeln.
Neuigkeiten wurden auch für OpenBSD verkündet. Das Projekt urunc liefert eine weitere Laufzeitumgebung für Container, die auf das Unikernel-Konzept zurückgreift. Daraus leitet sich auch der Name des Projekts ab. Das runc für Unikernels: urunc. Anstatt eines Prozesses in einem Container startet hier quasi ein kleiner Betriebssystemkern in abgeschotteter Umgebung. Das ist mit einer speziellen virtuellen Maschine vergleichbar und bereits von den Kata-Containern und Nabla bekannt. Das urunc-Projekt will einen speziellen Unikernel liefern, der mit BSD kompatibel ist. Dazu kommt ein minimalistisches Basissystem, um eine Anwendung ausführen zu können. Damit entfällt das Portieren von BSD-Anwendungen für Container. Sie müssen nicht mehr Linux-kompatibel sein. Es ist lediglich der Mehraufwand zum Verwalten der zusätzlichen Laufzeitumgebung urunc zu erbringen. Seit knapp einem Jahr ist das Projekt Teil der CNCF-Familie.
Weiterlesen nach der Anzeige
mTLS ohne Sidecars: Cilium integriert ztunnel
Ein wichtiges Thema im Netzwerkbereich der Container ist noch immer mTLS (mutual Transport Layer Security). Das Schlüsselwort dabei lautet CNI (Container Network Interface). Eine bekannte Größe hier ist Cilium. Das Projekt startete vor zehn Jahren und steht seit 2021 unter der Obhut der CNCF. Seit Version 1.19 beherrscht Cilium auch mTLS, und zwar ohne die Verwendung sogenannter Sidecars oder die Notwendigkeit zur Anpassung der Container-Anwendungen. Ein wesentlicher Baustein ist eBPF. Das Format erlaubt einerseits umfassende Einblicke in die Vorgänge in Containern und Pods, darüber hinaus lassen sich damit Sicherheitsrichtlinien implementieren und durchsetzen.
Der andere Baustein ist ztunnel, das man vom Service Mesh Istio kennt. Im sogenannten Ambient-Modus hat hier jeder Knoten einen kleinen Proxy, der sich um die TLS-Vorgänge kümmert. Diese in Rust geschriebene Komponente hat Cilium nun ebenfalls integriert. Damit ließen sich ein paar bekannte Probleme aus dem eBPF-Ansatz lösen. Die Authentisierung ist spezifisch für jede Sitzung und nicht nur per Knoten. Es gehen nun keine initialen Pakete beim Handschlag verloren. Außerdem steigt der Durchsatz insgesamt, da ztunnel größere Datenmengen zusammenfasst und verschlüsselt. Das Loslegen ist recht einfach und erfolgt in drei Schritten. Zunächst muss man das ztunnel-Feature in den Helm-Charts für Cilium einschalten. Danach gilt es den ztunnel auszurollen. Am Schluss muss man das Label io.cilium/mtls-enabled=true auf den entsprechenden Namensraum setzen. Alle Pods, die dann dort landen, verwenden automatisch mTLS.
Resümee und der Blick nach vorn
Nach drei Tagen KubeCon-Konferenz lässt sich festhalten, dass es zwar auch im 12. Jahr noch sehr viel Energie und Leidenschaft für Kubernetes und Co. gibt, allerdings auch noch recht grundlegende Probleme in verschiedenen Bereichen zu lösen sind – und das auch ganz ohne den KI-Hype.
Angesichts weiter wachsender Besucherzahlen muss die CNCF die Planung ihrer Hausmessen entsprechend langfristig vorbereiten: Die nächste KubeCon EU findet vom 15. bis 18. März 2027 in Barcelona statt. Auch der Termin für 2028 steht bereits fest: Berlin soll vom 24. bis 27. April zum Mittelpunkt des Cloud-Native-Universums werden.
(map)
-
Künstliche Intelligenzvor 3 MonatenSchnelles Boot statt Bus und Bahn: Was sich von London und New York lernen lässt
-
Social Mediavor 4 WochenCommunity Management und Zielgruppen-Analyse: Die besten Insights aus Blog und Podcast
-
Künstliche Intelligenzvor 1 Monat
Top 10: Die beste kabellose Überwachungskamera im Test – Akku, WLAN, LTE & Solar
-
Social Mediavor 1 MonatCommunity Management zwischen Reichweite und Verantwortung
-
UX/UI & Webdesignvor 2 MonatenEindrucksvolle neue Identity für White Ribbon › PAGE online
-
Künstliche Intelligenzvor 3 MonatenAumovio: neue Displaykonzepte und Zentralrechner mit NXP‑Prozessor
-
Künstliche Intelligenzvor 3 MonateneHealth: iOS‑App zeigt Störungen in der Telematikinfrastruktur
-
Apps & Mobile Entwicklungvor 3 MonatenX3D² bestätigt: Der AMD Ryzen 9 9950X3D2 mit doppeltem 3D V-Cache kommt!
