Entwicklung & Code
Neues JetBrains-Tool: Databao bringt semantische KI-Analytics in Unternehmen
Der tschechische Toolhersteller JetBrains erweitert sein Portfolio um ein neues Datenprodukt. Databao soll KI-gestützte Analysen auf eine kontrollierte und nachvollziehbare Grundlage stellen. Die KI wertet Daten nicht mehr direkt und ohne Kontext aus. Stattdessen legt Databao eine semantische Schicht über die Daten, in der wichtige Begriffe, Kennzahlen und Zusammenhänge eindeutig definiert sind. So arbeitet die KI mit klaren Regeln und einheitlichen Definitionen, was die Ergebnisse verständlicher und verlässlicher machen soll.
Weiterlesen nach der Anzeige
Damit adressiert JetBrains ein zentrales Problem vieler KI-Analytics-Ansätze. Sprachmodelle erzeugen zwar SQL-Abfragen, scheitern in der Praxis aber häufig an inkonsistenten Definitionen, fehlerhaften Joins oder missverstandenen Datentypen.
Kontext-Engine strukturiert die Datenbasis
Im Zentrum steht eine CLI-basierte Context Engine. Sie extrahiert Schemata und Metadaten aus Datenbanken sowie Informationen aus BI-Tools (Business Intelligence) und Dokumentationen. Daraus entsteht eine semantische Schicht, also eine formalisierte Beschreibung von Geschäftsbegriffen, Kennzahlen und Beziehungen zwischen Tabellen.
Diese Schicht gibt der KI einen klaren Rahmen vor. Sie nutzt festgelegte und geprüfte Definitionen, statt Tabellenstrukturen eigenständig zu interpretieren. So erzeugt sie zuverlässigere Abfragen und liefert bei gleichen Fragen konsistente Ergebnisse.
Das Diagramm zeigt, wie Databao Datenquellen über eine Context Engine in eine semantische Schicht überführt, auf der ein KI-Agent Analysen erzeugt und die Ergebnisse über eine teamfähige Plattform bereitstellt.
(Bild: JetBrains)
Open-Source-Agent erzeugt produktionsreifes SQL
Weiterlesen nach der Anzeige
Ergänzend stellt JetBrains einen Data Agent als quelloffenes Python-SDK (Software Development Kit) bereit. Der Agent nutzt die semantische Schicht, um SQL-Abfragen zu erzeugen, Daten aufzubereiten und Ergebnisse zu visualisieren. Laut Hersteller verarbeitet das System auch komplexe Abfragen mit mehreren Tabellen zuverlässig. JetBrains erreichte mit Databao kürzlich Platz eins im DBT-Track des SPIDER 2.0 Text-to-SQL-Benchmarks, einem der wichtigsten Benchmarks für SQL-Generierung.
Die Komponenten lassen sich lokal einsetzen. Perspektivisch will JetBrains Databao jedoch um eine SaaS-Ebene (Software as a Service) erweitern, die Teamfunktionen, gemeinsamen Kontext und produktionsreife Betriebsmodelle bietet.
Nähere Informationen zu Databao finden sich im Ankündigungsbeitrag auf dem JetBrains-Blog.
(mdo)