Entwicklung & Code

Snowflake und Salesforce starten offenen Standard für einheitliche KI-Daten


Ein Bündnis zahlreicher Technologieunternehmen – angeführt von Snowflake, Salesforce und dbt Labs – hat eine neue Initiative gestartet, um einen einheitlichen Standard für Geschäftsdaten zu schaffen. Open Semantic Interchange (OSI) soll den beteiligten Unternehmen zufolge ein zentrales Problem für KI-Anwendungen lösen: die inkonsistente Definition von Geschäftsdaten über verschiedene Systeme hinweg.




(Bild: iX)

Das Programm der data2day am 4. und 5. November 2025 bietet zahlreiche Einblicke in die Praxis rund um die Themen Datenarchitekturen und -Pipelines, Datenqualität und Governance sowie Agentic AI und Data Privacy.

Laut der Ankündigung sind neben den drei Hauptinitiatoren auch Alation, Atlan, BlackRock, Blue Yonder, Cube, Elementum AI, Hex, Honeydew, Mistral AI, Omni, RelationalAI, Select Star, Sigma und ThoughtSpot an dem Projekt beteiligt. Erklärtes Ziel ist es, eine standardisierte Semantik zu schaffen, die den widersprüchlichen Definitionen identischer Geschäftsbegriffe in verschiedenen Systemen ein Ende macht.

Welche Probleme sich in der Praxis ergeben, wenn ein KI-Modell Daten mit widersprüchlichen Definitionen abrufen und verarbeiten müsse, werde besonders deutlich an Begriffen wie „Werbeausgaben“, „aktiver Kunde“ oder „Bruttogewinnmarge“. Solche Begriffe sind demnach in verschiedenen IT-Systemen oft unterschiedlich definiert. Einzelhändler klassifizieren typischerweise in ihren Verkaufssystemen einen „aktiven Kunden“ als jemanden, der innerhalb der vergangenen 90 Tage gekauft hat, während das Marketing denselben Begriff für jeden verwendet, der im letzten Monat mit Inhalten interagiert hat.

Die OSI-Initiative zielt nun darauf ab, einen herstellerneutralen Standard zu schaffen, der es verschiedenen Organisationen ermöglicht, Daten über ihre Plattformen hinweg mit einem gemeinsamen Satz von Definitionen auszutauschen. Interoperabilität zwischen verschiedenen Datenanalyse-, KI- und Business-Intelligence-Anwendungen sowie -Diensten soll sichergestellt werden.

Die Spezifikation selbst hat die Initiative noch nicht veröffentlicht, das OSI-Modell soll aber die Darstellung semantischer Metadaten im standardisierten YAML-Format festlegen. Die semantische Definitionsdatei soll verschiedene Attribute enthalten, darunter Verweise auf Basistabellen, Verbindungsschlüssel und Beziehungen. Darüber hinaus könne sie auch eine Reihe von Metriken, Synonyme sowie benutzerdefinierte Anweisungen für KI umfassen. Die Arbeitsgruppe plant zudem, ein Open-Source-Repository einzurichten, das sowohl die Spezifikation selbst als auch Konverter enthält, die von verschiedenen Partnern beigesteuert werden können.

Die Initiative soll perspektivisch unter einer herstellerneutralen Verwaltung weitergeführt werden. Den Initiatoren zufolge lassen sich angesichts der unterschiedlichen Marktpositionen und strategischen Interessen der teilnehmenden Unternehmen nur so der langfristige Erfolg von OSI sicherstellen und weitere Partner für die Unterstützung gewinnen.

Mehr Details und weitergehende Informationen zur Open Semantic Interchange-Initiative finden sich in der offiziellen Ankündigung im Snowflake-Blog.


(map)



Source link

Beliebt

Die mobile Version verlassen