Connect with us

Entwicklung & Code

Cloudflare gibt KI-Agenten ein Langzeitgedächtnis


Cloudflare hat mit Agent Memory einen Dienst vorgestellt, der KI-Agenten ein dauerhaftes Gedächtnis verleihen soll. Anstatt alle nötigen Informationen immer wieder als Kontext mitzugeben – was einen hohen Tokenverbrauch verursacht –, sollen KI-Agenten mit Agent Memory eigenständig relevante Informationen auswählen und in ihren Prompts an die Sprachmodelle verwenden. Der Dienst steht zunächst nur in einer geschlossenen Beta-Version zur Verfügung.

Weiterlesen nach der Anzeige

Neben den potenziellen Kosteneinsparungen für Entwickler, die aus dem geringeren Tokenverbrauch folgen, will der US-Anbieter mit Agent Memory auch dem sogenannten Kontextverfall entgegenwirken. Lange Prompts verschlechtern zunehmend die Geschwindigkeit und Zuverlässigkeit von Antworten eines KI-Modells. Dabei gehen Informationen vom Anfang einer Konversation verloren, die nicht mehr in das Kontextfenster des jeweiligen Modells passen.

Laut einem Post im Cloudflare-Blog soll sich Agent Memory als persistente Speicherebene für lokal und in der Cloud gehostete KI-Agenten einsetzen lassen. Zudem können Entwickler den Dienst in Koordinations-Frameworks für mehrere Agenten einbinden, um den darin enthaltenen Agenten einen dauerhaften Speicher über Sessions und Neustarts hinweg zu bieten. Ebenfalls lassen sich Speicherprofile gemeinsam verwenden, sodass Informationen nur einmal an einen KI-Agenten übermittelt werden müssen und sich danach von mehreren Agenten nutzen und erweitern lassen.

Als möglichen Einsatzzweck für Agent Memory nennt Cloudflare die Einbindung in Coding-Agenten eines Entwicklungsteams. Initial können Entwickler grundlegende Informationen eingeben, die für alle Agenten wichtig sind, beispielsweise interne Konventionen oder Architekturentscheidungen. Danach nutzen und erweitern alle angebundenen Agenten diese Informationen.

Außerdem lässt sich der Dienst zur agentischen Code-Review einsetzen – er soll sich merken können, was die Entwickler zurückweisen. Mit diesen Informationen soll der KI-Agent sein Feedback zum Programmcode anpassen und relevantere Hinweise geben können. Auch in einfachen Chatbots lässt sich Agent Memory einbinden, um den Nachrichtenverlauf zu speichern und bei Nachfrage darauf zurückgreifen zu können.

Weiterlesen nach der Anzeige

Agent Memory unterscheidet bei den Informationen zwischen unveränderlichen Fakten, Events früherer Zeitpunkte, aktuellen Aufgaben und Anweisungen wie Arbeitsabläufen oder Runbooks. Der Dienst aktualisiert eigenständig veraltete Informationen und löscht Duplikate. Zugriffe auf die Informationen erfolgen über eine Anbindung an Cloudflare Workers oder eine REST-API.

Die Schnittstelle bietet fünf Kernoperationen: ingest für die Massenverarbeitung von Konversationen, remember für explizites Speichern, recall für synthetisierte Abfragen sowie list und forget für Verwaltung und Löschung. Um die gesamte API-Oberfläche abzubilden, veröffentlichte Cloudflare zuletzt mit cf ein einheitliches Kommandozeilen-Tool. Mit ihm sollen Entwickler alle Dienste des Anbieters über ein zentrales Werkzeug steuern und von KI-Agenten nutzen lassen können.

Eine Anmeldung zur geschlossenen Beta von Agent Memory ist aktuell nicht möglich, eine Warteliste steht aber bereit. Der Zeitpunkt für die allgemeine Verfügbarkeit ist bislang nicht bekannt.


(sfe)



Source link

Entwicklung & Code

Cloudflare kauft Vite: Open Source und herstellerneutral – mit Millionenfonds


Cloudflare übernimmt VoidZero, das Unternehmen hinter den JavaScript-Werkzeugen Vite, Vitest, Rolldown, Oxc und Vite+. Das gab der Cloud- und Netzwerkdienstleister am Donnerstag in einem Blogbeitrag bekannt. Mit der Übernahme wechselt auch das gesamte VoidZero-Team um Gründer Evan You zu Cloudflare. Zu den finanziellen Konditionen machen beide Unternehmen keine Angaben. Auch zum Zeitplan, zu möglichen behördlichen Genehmigungen und zu weiteren Abschlussbedingungen gibt es bislang keine weiteren Informationen.

Weiterlesen nach der Anzeige

Für Entwickler dürfte vor allem die Zukunft der Open-Source-Projekte zählen. Hier betonen Cloudflare und VoidZero explizit, dass Vite, Vitest, Rolldown, Oxc und Vite+ quelloffen, herstellerneutral und community-getrieben bleiben sollen. Die Projekte bleiben demnach wie gehabt Open-Source-Software. Und Anwendungen, die auf Vite aufbauen, sollen sich weiterhin unabhängig von Cloudflare auch auf anderen Plattformen betreiben lassen.

VoidZero stammt von Evan You, der auch das JavaScript-Framework Vue.js entwickelt hat. Das Unternehmen baut eine ganze Reihe von Werkzeugen für moderne Webanwendungen. Dazu gehören das Build- und Entwicklungswerkzeug Vite, das Test-Framework Vitest, der in Rust geschriebene Bundler Rolldown sowie die ebenfalls in Rust entwickelte Toolchain Oxc, die Komponenten zum Parsen, Linten und Formatieren von JavaScript- und TypeScript-Code mitbringt. Mit Vite+ will VoidZero diese Werkzeuge unter einer einheitlichen Toolchain zusammenführen.

Vor allem Vite hat sich in den vergangenen Jahren zu einer zentralen Infrastruktur des JavaScript-Ökosystems entwickelt. Das Werkzeug treibt längst nicht mehr nur Vue-Projekte an, sondern bildet auch die Grundlage zahlreicher Frameworks und Meta-Frameworks wie Nuxt, SvelteKit, Astro, Solid, Qwik oder Angular. Auch mehrere React-basierte Werkzeuge setzen inzwischen auf Vite.

Cloudflare will zusätzliche Ressourcen in die Weiterentwicklung der Projekte stecken. Die Leitung sollen weiterhin Evan You und das bisherige VoidZero-Team übernehmen. Darüber hinaus richtet das Unternehmen einen Fonds über eine Million US-Dollar für das Vite-Ökosystem ein. Damit will Cloudflare Maintainer und weitere Community-Mitglieder unterstützen. Verwalten soll den Fonds das Vite-Kernteam. Ähnlich verfuhr Cloudflare eigenen Angaben zufolge bereits Anfang 2026 beim Web-Framework Astro: Auch dessen Team wechselte zu Cloudflare, ebenfalls unter Beibehaltung der Open-Source-Ausrichtung.

Weiterlesen nach der Anzeige

Hinter der Übernahme steckt eine Zusammenarbeit der Unternehmen, die schon länger läuft. Cloudflare und das Vite-Team arbeiten nach eigenen Angaben seit 2024 zusammen, unter anderem an der Environment API. Sie erlaubt es, Server-Code während der lokalen Entwicklung in anderen Laufzeitumgebungen als Node.js auszuführen.

Damit adressiert die Schnittstelle ein altbekanntes Problem: Viele Anwendungen entstehen lokal unter Node.js, laufen in der Produktion aber in einer anderen Laufzeitumgebung. Genau diese Unterschiede zwischen Entwicklung und Produktion führen immer wieder zu Fehlern. Über die Environment API können Anbieter ihre eigenen Laufzeiten direkt in den lokalen Entwicklungsprozess einklinken. Bei Cloudflare übernimmt das die quelloffene Laufzeitumgebung workerd, die auch den Dienst Cloudflare Workers antreibt.

Die Übernahme soll außerdem die künftige Entwicklerplattform von Cloudflare prägen. Das Unternehmen will seine Werkzeuge stärker an Vite ausrichten. So soll das neue Cloudflare-CLI-Tool cf langfristig auf Vite-Workflows aufsetzen. Lokale Entwicklung, Builds und das Deployment auf die Cloudflare-Plattform würden dadurch enger zusammenrücken.

Auch für Vite selbst kündigen die Unternehmen weitergehende Pläne an. Das Projekt soll künftig stärker Full-Stack-Anwendungen unterstützen. Geplant sind unter anderem allgemeine Schnittstellen für Backends, APIs, Deployments und KI-Agenten. Diese Erweiterungen sollen aber plattformneutral bleiben und nicht exklusiv an Cloudflare-Dienste gebunden sein.


(fo)



Source link

Weiterlesen

Entwicklung & Code

Perplexity verteilt automatisiert KI-Rechenbedarf zwischen Gerät und Cloud


Perplexity hat einen Hybrid-Ansatz für KI-Inferenz angekündigt, der Aufgaben automatisch zwischen dem lokalen Rechner und Cloud-Servern aufteilt. Der sogenannte „Personal Computer“, Perplexitys Variante von persönlichen Desktop-Agenten, soll sensible Daten auf dem Gerät halten und rechenintensive Arbeit in die Cloud auslagern – ohne dass Nutzer vorab entscheiden müssen, wo etwas verarbeitet wird.

Weiterlesen nach der Anzeige

Perplexity beschreibt den neuen Dienst als kompaktes KI-Modell, das lokal auf dem Gerät läuft und entscheidet, welche Teile einer Anfrage dort verbleiben und welche an ein leistungsfähigeres Frontier-Modell in der Cloud gehen sollen. Als typische Anwendungsfälle nennt das Unternehmen den Umgang mit Finanzunterlagen, Gesundheitsinformationen und persönlichen Dateien – also Daten, die aus Datenschutzgründen das Gerät möglichst nicht verlassen sollten.

Ganz neu ist Perplexitys hybrider Ansatz nicht, andere Anbieter haben ähnliche Ansätze. Microsoft verfolgt zum Beispiel mit Copilot+ PCs und lokalen NPU-Funktionen ebenfalls einen Hybridkurs, auch wenn viele Copilot-Funktionen weiterhin eine Cloud-Verbindung benötigen.

Der wesentliche Unterschied liegt laut VentureBeat wohl im Anspruch, die Aufteilung vollautomatisch und aufgabenweise, teils auch während die Aufgabe läuft, vorzunehmen. Auf dem Level, auf dem Perplexity das auf der Computex demonstriert hat, sind andere Anbieter bisher nicht.

Ab Juli soll Personal Computer mit lokaler Inferenz verfügbar werden und dabei helfen, aktuell typische Zielkonflikte zwischen drei Faktoren zu reduzieren: Genauigkeit und komplexe Aufgaben erfordern die leistungsfähigsten, rechenintensiven Modelle, Datenschutz verlangt lokale Verarbeitung und Kosten verlangen einen effizienten Mix zwischen leistungsstarken und günstigen Modellen – je nach Aufgabe. Die Orchestrierung zwischen diesen Anforderungen sei das eigentliche Problem. Genau das wolle der Hybrid-Ansatz nun lösen.

Perplexity stellte den Hybrid-Orchestrator gemeinsam mit Intel vor. Der modellagnostische Orchestrierungsrahmen soll aber auch auf anderer lokaler Hardware laufen, darunter Nvidias RTX Spark. Konkrete Hardware-Mindestanforderungen – etwa zur nötigen NPU- oder GPU-Leistung – nennt Perplexity bislang nicht. Der Computerhersteller HP hat zum Beispiel für Microsofts hybrides Modell Copilot+ PC entschieden, dass Laptops für das Copilot+ PC-Label eine dedizierte Neural Processing Unit (NPU) von mindestens 40 TOPS benötigen.

Weiterlesen nach der Anzeige

Ebenso fehlen bei Perplexity noch technische Details zu den Routing-Regeln: Wie genau das lokale Modell entscheidet, welche Daten als sensibel gelten und welche Metadaten dennoch an Perplexity-Server übertragen werden könnten, bleibt offen.

Wie belastbar das Datenschutzversprechen im Alltag ist, lässt sich auch erst bewerten, wenn Perplexity technische Dokumentation zu Modellgrößen, Speicherbedarf und dem Umgang mit Telemetriedaten veröffentlicht.


(rie)



Source link

Weiterlesen

Entwicklung & Code

Microsoft Store: Entwicklerkonto für Unternehmen wird kostenlos


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Microsoft vereinfacht die Veröffentlichung von Anwendungen im Microsoft Store für Unternehmen. Firmen müssen für ein Entwicklerkonto künftig keine Registrierungsgebühr mehr bezahlen. Außerdem können sie sich mit Microsoft-Entra-ID-Arbeitskonten anmelden. Ein überarbeiteter Registrierungsprozess soll den Weg von der Kontoerstellung bis zur ersten App-Veröffentlichung verkürzen.

Weiterlesen nach der Anzeige

Der Microsoft Store ist Microsofts zentrale Plattform für die Verteilung von Anwendungen unter Windows. Entwickler können dort Apps bereitstellen, aktualisieren und sowohl Endanwender als auch Unternehmenskunden erreichen. In Unternehmensumgebungen lassen sich Anwendungen unter anderem über Microsoft Intune verwalten und verteilen. Nach Angaben von Microsoft zählt der Store mehr als 250 Millionen monatlich aktive Nutzer.

Unterstützt werden verschiedene Anwendungstypen, darunter klassische Win32-Anwendungen, UWP-Apps, Progressive Web Apps (PWA), .NET-MAUI- und Electron-Anwendungen. Microsoft versucht seit einigen Jahren, den Store auch für Anbieter klassischer Desktopsoftware attraktiver zu machen.

Die auffälligste Änderung betrifft die Registrierungskosten. Bislang mussten Unternehmen eine einmalige Gebühr von 99 US-Dollar entrichten, um ein Entwicklerkonto für den Microsoft Store anzulegen. Diese Gebühr entfällt nun.

Microsoft hatte bereits im vergangenen Jahr die Registrierungsgebühr für Einzelentwickler abgeschafft. Nun gilt die Gebührenfreiheit auch für Unternehmen. Im Vergleich zu anderen großen App-Plattformen fällt Microsoft damit aus der Reihe: Apple verlangt für die Teilnahme am Apple Developer Program weiterhin 99 US-Dollar pro Jahr, während Google für ein Entwicklerkonto in der Play Console eine einmalige Gebühr von 25 US-Dollar erhebt.

Weiterlesen nach der Anzeige

Neu ist außerdem die Anmeldung über Microsoft Entra ID. Die Plattform, die früher unter dem Namen Azure Active Directory bekannt war, dient Unternehmen zur Verwaltung von Identitäten und Zugriffsrechten.

Mitarbeiter können damit ihr bestehendes Firmenkonto nutzen, statt ein separates Microsoft-Konto anzulegen. Laut Microsoft vereinfacht das die Zuordnung von Entwicklerkonten zu Organisationen und reduziert den Verwaltungsaufwand.

Parallel dazu hat Microsoft den Registrierungsprozess überarbeitet. Die neue Oberfläche führt Unternehmen schrittweise durch die Anmeldung, prüft Eingaben frühzeitig auf mögliche Fehler und zeigt den Status von Verifizierungen in Echtzeit an. Viele Prüfungen laufen laut Microsoft automatisch ab.

Benachrichtigungen per E-Mail informieren über den Fortschritt und weisen auf fehlende Angaben oder erforderliche Nachweise hin. Das soll Rückfragen reduzieren und den Zeitraum bis zur ersten App-Einreichung verkürzen.

Für eine möglichst schnelle Freischaltung empfiehlt Microsoft Unternehmen, bereits vor der Registrierung bestimmte Informationen bereitzuhalten. Besonders hilfreich sei eine D‑U‑N‑S-Nummer. Mit der von Dun & Bradstreet vergebenen Unternehmenskennung lassen sich Firmendaten automatisch abgleichen, was die Verifizierung beschleunigen kann.

Unternehmen ohne D‑U‑N‑S-Nummer können stattdessen Dokumente wie Handelsregisterauszüge, Gewerbenachweise oder andere offizielle Nachweise hochladen. Damit kann die Prüfung jedoch länger dauern. Zudem sind Verifizierungsversuche auf maximal drei Einreichungen begrenzt, weshalb Microsoft empfiehlt, nur korrekte und vollständige Dokumente hochzuladen. Außerdem empfiehlt Microsoft die Verwendung einer E-Mail-Adresse aus der eigenen Unternehmensdomäne, da andernfalls zusätzliche Nachweise erforderlich sein können.

Mit den Änderungen will Microsoft den Store als Vertriebskanal für Windows-Anwendungen attraktiver machen. Der Konzern verweist darauf, dass sich viele Anwendungen ohne größere Anpassungen veröffentlichen lassen. Für Nicht-Spiele-Anwendungen erlaubt Microsoft weiterhin eigene In-App-Bezahlsysteme. In diesen Fällen behalten Entwickler die gesamten Umsätze. Die Neuerungen sollen vor allem die Einstiegshürden für Softwareanbieter und interne Entwicklungsteams senken, schreibt Microsoft in seinem Blogbeitrag zur vereinfachten Veröffentlichung von Unternehmensanwendungen im Microsoft Store.


(fo)



Source link

Weiterlesen

Beliebt