Entwicklung & Code

Open Knowledge Format: KI-Wissen als Markdown-Dateien


Google Cloud hat mit dem Open Knowledge Format (OKF) eine offene Spezifikation vorgestellt, die Kontextwissen für KI-Systeme und Agenten plattformübergreifend nutzbar machen soll. Das Format richtet sich an Unternehmen, die Metadaten, Dokumentationen, Runbooks oder fachliche Definitionen zentral für den KI-Einsatz bereitstellen wollen. Google hat die Unterstützung für OKF bereits in den eigenen Knowledge Catalog integriert.

Weiterlesen nach der Anzeige

Mit dem Format greift Google einen Ansatz auf, der sich unter Entwicklern von KI-Agenten in den vergangenen Monaten verbreitet hat. Statt Agenten immer wieder dieselben Informationen aus Wikis, Datenkatalogen oder Dokumentationen heraussuchen zu lassen, legen Teams ihr Wissen strukturiert als Sammlung von Markdown-Dateien ab. KI-Forscher Andrej Karpathy hat dieses Muster als „LLM Wiki“ beschrieben. Verwandte Konzepte stecken in Obsidian-Vaults, in Konfigurationsdateien für Agenten wie AGENTS.md oder CLAUDE.md sowie in sogenannten „Metadata as Code“-Repositories.

Diese Ansätze nutzen zwar ähnliche Bausteine – Markdown-Dateien, Metadatenfelder und Querverweise –, bleiben aber meist auf einzelne Teams, Werkzeuge oder Anbieter beschränkt. Wissen lässt sich so kaum zwischen verschiedenen KI-Systemen wiederverwenden. Genau hier setzt Google an: OKF soll die nötigen Konventionen festlegen, mit denen unterschiedliche Werkzeuge dieselben Wissensbestände lesen und schreiben können – ohne Übersetzungsschicht und ohne herstellereigenes SDK.

Ein OKF-Bundle besteht aus einem Verzeichnis von Markdown-Dateien. Jede Datei beschreibt genau ein Konzept, etwa eine Datenbanktabelle, einen Datensatz, eine API, eine Geschäftsmetrik, ein Runbook oder ein Playbook. Das YAML-Frontmatter enthält strukturierte Felder wie type, title, description, resource, tags und timestamp.

Die einzelnen Dateien verknüpfen sich über gewöhnliche Markdown-Links. So entsteht ein Wissensgraph, der die Beziehungen zwischen den Konzepten abbildet. Die Dokumentation einer Bestelltabelle kann etwa auf Kunden- und Produktdaten sowie auf die Definition einer Umsatzkennzahl verweisen. Ein KI-Agent bekommt damit nicht nur einzelne Dokumente, sondern auch deren fachliche Zusammenhänge.

Weiterlesen nach der Anzeige

Google beschreibt in der Ankündigung OKF ausdrücklich als Format und nicht als Plattform. Die Spezifikation soll unabhängig von Cloud-Anbietern, Datenbanken, KI-Modellen oder Agenten-Frameworks funktionieren. Den Standard halten die Entwickler bewusst schlank: Verpflichtend ist allein ein Typfeld, alle weiteren Strukturen und Metadaten dürfen die Anwender selbst festlegen. OKF schreibt damit nur die Interoperabilität vor, nicht aber ein einheitliches Inhaltsmodell.

Zusammen mit der Spezifikation liefert Google mehrere Referenzimplementierungen aus. Dazu zählt ein Enrichment-Agent für BigQuery, der Tabellen und Views analysiert und daraus automatisch OKF-Dokumente erzeugt. In einem zweiten Durchlauf reichert ein Sprachmodell die Dokumente um Schemainformationen, Dokumentation, Quellenangaben und Join-Beziehungen an. Hinzu kommt ein statischer HTML-Viewer, der einen OKF-Bestand als interaktiven Wissensgraphen darstellt, ganz ohne Backend.

Zum Ausprobieren stellt Google Beispielbestände für Datensätze aus GA4 E-Commerce, Stack Overflow und öffentlichen Bitcoin-Datensätzen bereit. Spezifikation, Beispielcode und Referenzimplementierungen liegen auf GitHub.

Die Spezifikation liegt bislang in Version 0.1 vor. Google bezeichnet sie als Ausgangspunkt und will sie gemeinsam mit der Community rückwärtskompatibel weiterentwickeln. Produzenten und Konsumenten des Formats – etwa Datenkataloge, Suchsysteme oder KI-Agenten – sollen dabei unabhängig voneinander entstehen.


(fo)



Source link

Beliebt

Die mobile Version verlassen