Entwicklung & Code

Googles WebMCP macht Websites zu strukturierten Datenquellen für KI-Agenten


Google hat mit WebMCP (Web Model Context Protocol) eine neue JavaScript-Schnittstelle vorgestellt, über die KI-Agenten standardisiert mit Websites kommunizieren sollen. Wie Google-Entwickler André Cipriani Bandarra in einem Blogbeitrag erklärt, überträgt WebMCP die Idee des Model Context Protocol auf Websites, sodass KI-Agenten im Browser strukturiert mit Webseiten interagieren können – ohne das DOM der Seite scrapen und sich durch den Code klicken zu müssen.

Weiterlesen nach der Anzeige

Über die Schnittstelle können KI-Agenten gezielt Aktionen auf Websites ausführen, beispielsweise Formulare ausfüllen, Produkte suchen und bestellen oder Flüge buchen. „WebMCP zielt darauf ab, einen Standard für strukturierte Tools bereitzustellen, um sicherzustellen, dass KI-Agenten Aktionen mit erhöhter Geschwindigkeit, Zuverlässigkeit und Präzision ausführen können“, sagt Bandarra.

WebMCP erweitert das Navigator-Interface um navigator.modelContext mit Methoden wie registerTool() und provideContext(). Google unterscheidet dabei zwischen einer deklarativen API für einfache Formular-Aktionen und einer imperativen API für komplexe JavaScript-Interaktionen. Jedes registrierte Tool benötigt einen Namen, eine Beschreibung in natürlicher Sprache, ein JSON-Schema für Eingaben sowie eine Execute-Callback-Funktion.

Microsoft hatte Mitte 2025 mit NLWeb ein eigenes Open-Source-Projekt für das „agentische Web“ vorgestellt. Der zentrale Unterschied: NLWeb ist serverseitig konzipiert und macht Webseiten zu MCP-Servern mit natürlichen Sprachschnittstellen. WebMCP hingegen läuft im Browser im JavaScript-Kontext, ohne separate Backend-Komponenten.

Laut der offiziellen WebMCP-Spezifikation der W3C Web Machine Learning Community Group arbeiten Google und Microsoft mittlerweile gemeinsam an dem WebMCP-Standard. Als Co-Autoren sind neben Google-Entwicklern auch Microsoft-Entwickler gelistet, was auf eine mögliche Konvergenz hindeutet.

WebMCP steht derzeit als Early Preview über Googles Early-Access-Programm für Entwickler bereit und ist in Chrome 146 als DevTrial verfügbar. Google könnte die Schnittstelle künftig in Chrome und seine KI-Dienste wie Gemini integrieren, um Browser-Agenten direkt mit Websites interagieren zu lassen.

Weiterlesen nach der Anzeige


(odi)



Source link

Beliebt

Die mobile Version verlassen