Künstliche Intelligenz
Cisco-KI löst, Mensch entscheidet – die Zukunft des Netzwerk-Troubleshooting?
Nachdem Cisco bisher viel über KI geredet, aber wenig konkrete Lösungen aufgezeigt hat, gibt es nun mit AI Canvas einen interessanten Ansatz. In der Keynote der Live-Hausmesse gab es einen KI-Agenten für ein automatisiertes Netzwerk-Troubleshooting zu sehen, der mit unterschiedlichen Datenquellen die Grundursache (Root Cause) eines Netzwerkproblems analysierte, Lösungen vorschlug und sie nach menschlicher Freigabe umsetzte und im Nachgang die Effektivität der Lösung validierte.
Hinter AI Canvas steckt ein webbasiertes Dashboard mit einem KI-Assistenten, über den der Netzwerkverantwortliche eine Konversation führen kann und ihm als Agent dienen soll. Er führt durch die Diagnose und stimmt Entscheidungen sowie Lösungen mit dem Nutzer des Tools basierend auf Live-Telemetrie und Erfahrungen von Netzwerkexperten ab.
Die Basis für das Troubleshooting liefert ein auf den spezifischen Einsatzzweck spezialisiertes LLM namens Cisco Deep Network Model. Es wurde nach Angaben von Cisco mit über 40 Millionen Token trainiert und Experten haben über 3000 Reasoning Traces beigesteuert und jede Logikebene sorgfältig kommentiert und validiert. Konkret greift der Hersteller dabei auf Erkenntnisse aus dem Technical Assist Center (TAC) zurück, um aus gelösten Problemen zu lernen.
Für das Dashboard sollen die Daten aus dem Netzwerk, der Cloud, aus Security-Tools, Observability und Kollaborationsplattformen herangezogen werden, um ein möglichst vollständiges Bild zu erhalten. Das Zusammenspiel der unterschiedlichen Agenten, die Telemetriedaten beziehen, potenzielle Fehler des Netzwerks ermitteln und Lösungen vorschlagen, sortiert Cisco unter dem Schlagwort AgenticOps ein. „Das Zeitalter der agentenbasierten KI steht vor der Tür“, meinte DJ Sampath, Vice President für Produkte, KI-Software und -Plattform bei Cisco.
(Bild: Cisco)
AI Canvas im Praxisbeispiel
Als Beispiel zeigte Cisco ein offenes ServiceNow-Ticket, das mit der Ticketnummer im AI Assistent von AI Canvas eingefügt wurde. AI Canvas zog sich daraufhin die Inhalte des Tickets aus ServiceNow, um das konkrete Problem zu erfassen. Im Anschluss darauf bezog es Daten aus den Cloud-Plattformen von Meraki, ThousandEyes und Splunk und analysierte sie mithilfe des Deep Network Model. Daraufhin begann AI Canvas schrittweise ein Dashboard mit diversen Widgets und Grafiken zu generieren, aus denen es relevante Erkenntnisse aus unterschiedlichen Plattformen aufzeigte.
Aus dem Meraki Dashboard zeigte sich ein erhöhter Paketverlust von einer Meraki-MX-Firewall, Splunk lieferte eine Meldung zu gesteigerten TCP Retransmissions und die Pfad-Visualisierung aus ThousandEyes zeigte den konkreten Punkt auf, an dem der Paketverlust entstand, nämlich ein überlasteter WAN-Link. Um den Engpass für eine betriebskritische Cloud-Applikation zu umgehen, schlug das Tool die Implementierung einer QoS-Richtlinie im SD-WAN auf der Firewall vor. Der Mensch musste diese freigeben, AI Canvas führte den Change eigenständig gegenüber der Meraki-Plattform per API aus und validierte im Nachgang die Qualität via ThousandEyes.
Dabei überzeugte der nahtlose Ablauf ohne Wechsel zwischen den Dashboards der unterschiedlichen Lösungen, die Einbindung des Systemverantwortlichen in Entscheidungen durch den Assistenten und die Geschwindigkeit zur Lösung. Zusätzlich zeigte Cisco auch, wie sich andere Personen in ein kollaboratives Troubleshooting hinzuziehen lassen – und verwies darauf, dass Troubleshooting ein Team-Sport statt ein Fingerzeigen ist, was einige Systemverantwortliche gern übersehen.
Kontrolle durch Menschen
Cisco unterstreicht, dass AI Canvas das IT-Betriebspersonal nicht ersetzen, sondern nur unterstützen soll. Dabei soll der Mensch stets Teil des Prozesses sein, um sicherzustellen, dass alle Vorgänge regelkonform ablaufen. Cisco betont die Transparenz in jeder Phase, etwa durch nachvollziehbare Angaben zur Herkunft der verwendeten Daten. Die zentrale Idee: Während AI Canvas repetitive und aufwendige Aufgaben übernimmt, liegt die finale Entscheidungsverantwortung weiterhin beim Menschen.
Langfristig sieht es so aus, als ob kritische Prozesse stark von der Automatisierung durch agentenbasierte Systeme profitieren können, um den Menschen in kritischen Situationen eine schnellere Fehlerbehebung zu ermöglichen. Dabei erwartet Cisco, dass Mitarbeiter künftig eher Prüf- und Freigabeschritte durchführen müssen, bevor autonome KI-Agenten vollumfängliche Entscheidungsbefugnisse erhalten. Dazu nannte der Hersteller im Gespräch mit iX, dass man auf Basis der hauseigenen Duo-Lösung einen Ansatz für delegierte Privilegien für Agenten hat, um entsprechende Authentifizierungen für agentische Identitäten, deren Autorisierungen zu steuern und deren ausgeführte Tätigkeiten zu überwachen.
(fo)