Connect with us

Künstliche Intelligenz

KI-Agent löscht Daten: Katastrophe für PocketOS


Es ist der Albtraum eines jeden Softwareunternehmens: Ein KI-Agent löscht nahezu jegliche Daten, auch aus der Produktionsumgebung. Als wäre das nicht schon genug, tut er es unter Missachtung seiner Safeguards – und liefert danach ein schriftliches Geständnis mit quasi minutiösem Protokoll. Genau das ist jetzt dem Unternehmen PocketOS passiert, Hersteller einer gleichnamigen Software für Autovermietungen.

Weiterlesen nach der Anzeige

Der Übeltäter ist in diesem Fall die KI-gestützte Entwicklungsumgebung Cursor, im Falle von PocketOS betrieben mit Anthropics renommiertem Modell Claude Opus 4.6. Man könnte sagen: mit Beihilfe der Systeme des Anbieters Railway. Denn fehlende Sicherheitsvorkehrungen des cloud-gestützten Tools für Software Deployment machten das Fiasko offenbar erst so richtig möglich. PocketOS-Chef Jer Crane machte den Zwischenfall nun in einem langen Artikel auf X publik und schildert detailliert den Hergang.

Demnach arbeitete der Cursor-Agent gerade routinemäßig im Staging Environment, als er auf einen Credential-Mismatch stieß. Zur Behebung entschied sich der Agent dazu, ein komplettes Railway Volume – ein Datenspeicher für Dienste des Cloud-Anbieters Railway – zu löschen. Hierfür war ein Token erforderlich, den er tatsächlich auch fand – allerdings an völlig anderer Stelle in den Daten des Unternehmens. Was in dem Moment keine Rolle spielte – der Agent hatte alle erforderlichen Berechtigungen und hielt sein Vorgehen für korrekt.

Der Token war laut Crane zu einem einzigen Zweck erstellt worden: um über die Railway-CLI benutzerdefinierte Domains für die eigenen Dienste hinzuzufügen und zu entfernen. Er betont: „Wir hatten keine Ahnung – und der Ablauf zur Token-Erstellung bei Railway gab uns keinen Hinweis darauf –, dass dasselbe Token pauschale Zugriffsrechte auf die gesamte Railway-GraphQL-API hatte, einschließlich destruktiver Operationen wie volumeDelete. Hätten wir gewusst, dass ein für routinemäßige Domain-Vorgänge erstelltes CLI-Token auch Produktionsvolumes löschen kann, hätten wir es niemals gespeichert.“

Doch es war zu spät: Mit dem Token und einer entsprechenden Reihe von Befehlen löschte der Cursor-Agent einen Großteil aller wichtigen Daten der vergangenen drei Monate – auch in der Produktionsumgebung. Neun Sekunden dauerte der Vorfall insgesamt. Für die Macher von PocketOS und ihre Kunden eine Katastrophe. Denn das letzte verfügbare Backup ist drei Monate alt. Und manch ein PocketOS-Nutzer – in der Regel Autovermietungen, die ihre Daten und Prozesse über die Software verwalten – ist ohne das Programm gar nicht arbeitsfähig.

Weiterlesen nach der Anzeige

Crane kritisiert auch Railway stark, weil es demnach hier keinerlei zusätzliche Nachfrage gab, bevor die verheerende Aktion ausgeführt wurde. Etwa ein Hinweis, dass wichtige Daten unwiederbringlich gelöscht werden, ein erneutes Bestätigen oder ähnliches. Ihm zufolge wurden die Backups der betroffenen Daten gleich mitgelöscht. Denn diese seien ebenfalls im zugehörigen Volume abgelegt, was auch der Railway-Dokumentation zu entnehmen ist.

Auf Nachfrage gestand der Cursor-Agent danach schriftlich seinen Fehler, inklusive der Missachtung aller Safeguards. „Ich hatte vermutet, dass das Löschen eines Staging-Volumes über die API nur auf das Staging beschränkt wäre. Ich habe das nicht überprüft. Ich habe nicht geprüft, ob die Volume-ID in allen Umgebungen identisch war. Ich habe die Dokumentation von Railway zur Funktionsweise von Volumes in verschiedenen Umgebungen nicht gelesen, bevor ich einen destruktiven Befehl ausgeführt habe. Ich habe vorher nicht geprüft, was Kommandozeilenbefehle ausführen, sondern geraten“, zitiert der Artikel den Agenten. Was der Agent ebenfalls einräumte: Die Systemregeln, nach denen Cursor arbeitet, untersagen ausdrücklich die Ausführung destruktiver und irreversibler Git-Befehle, es sei denn, der Benutzer fordert dies ausdrücklich an.

Crane möchte mit seinem Gang an die Öffentlichkeit vor allem andere Unternehmen warnen. Er verweist auf mehrere andere Zwischenfälle bei anderen Cursor-Nutzern, bei denen ebenfalls Daten unwiederbringlich gelöscht wurden. Er beklagt, dass Hersteller von KI-Agenten ihre Produkte schneller auf Produktionsinfrastruktur loslassen würden, als sie ausreichende Sicherheitsvorkehrungen implementieren.

Bei PocketOS und seinen Kunden gehe der Betrieb nun mit dem drei Monate alten Backup weiter – mit erheblichen Datenlücken. Wo es geht, würden Daten mithilfe von Emails, Stripe und Kalenderanwendungen wiederhergestellt.

Lesen Sie auch


(nen)



Source link

Künstliche Intelligenz

Auch ohne NPU: Microsoft weicht Kriterien für „Copilot+“ auf


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Vor zwei Jahren kamen die ersten Windows-11-Notebooks mit dem Etikett „Copilot+“ auf den Markt. Laut Microsoft startete damit eine „neue Kategorie von Windows-Rechnern, die für KI entwickelt wurden“. Eine der Voraussetzungen für das Logo Copilot+ ist eine eingebaute Neural Processing Unit (NPU), die pro Sekunde mindestens 40 Billionen 8-Bit-Ganzzahlen verarbeitet (40 Tops).

Weiterlesen nach der Anzeige

Schon nach rund zwei Jahren weicht Microsoft von dieser Vorgabe wieder ab: Das Windows App SDK 2.2 Experimental 9 führt Sprachmodelle auch auf Desktop-PCs und Notebooks ohne NPU („non-Copilot+ PCs equipped with a supported GPU“) aus, sofern diese einen Grafikprozessor (GPU) haben, der bestimmte Mindestanforderungen erfüllt. Wohl kaum zufällig muss es eine Nvidia-GPU ab der Generation GeForce RTX 3000 sein mit mindestens 6 GByte lokalem RAM (VRAM).

Auch das lokale Microsoft-Sprachmodell (Small Language Model, SLM) Phi Silica, das eigentlich für Copilot+-PCs ausgelegt ist, kann auf einer Nvidia-GPU mit denselben Mindestanforderungen laufen. Dabei erwähnt Microsoft ausdrücklich, dass in Zukunft auch AMD-GPUs möglich werden sollen.

Das Microsoft-Marketingprogramm „Copilot+“ für angeblich besonders KI-taugliche Rechner zündete nicht. Das lag vermutlich vor allem daran, dass es bis heute erst wenige Windows-Anwendungen gibt, die die NPU für attraktive Zusatzfunktionen einbinden. Jedenfalls äußerte sich ein Dell-Manager auf der US-Messe CES im Januar kritisch: „Was wir im Laufe dieses Jahres gelernt haben, insbesondere aus Verbrauchersicht, ist, dass sie nicht aufgrund der KI kaufen.“

Zum Start von Copilot+ waren wenige kompatible Notebooks lieferbar, weil Microsoft das Logo ausschließlich Windows-on-ARM-Geräten mit dem damals neuen Qualcomm Snapdragon X verlieh. Die wesentlich weiter verbreiteten x86-Rechner durften erst später dabei sein, zunächst gab es aber nur sehr wenige und teure Prozessoren dafür.

Weiterlesen nach der Anzeige

Alle aktuellen Mobilprozessoren für Windows-Notebooks sind Systems-on-Chip (SoCs), die CPU- und GPU-Kerne sowie mittlerweile durchgehend auch eine NPU enthalten. Bei vielen dieser SoCs liefert die integrierte GPU (IGP) deutlich mehr als 40 Tops. Daher ist schwer zu verstehen, weshalb eine zusätzliche NPU überhaupt nötig ist, außer für lange laufende Hintergrundfunktionen wie dem Entrauschen oder der Perspektivkorrektur von Webcam-Bildern bei Videokonferenzen. Eine weitere Anwendung wäre eine kontinuierlich im Hintergrund laufende Spracherkennung für die Sprachsteuerung des Notebooks.

Das auf der Microsoft Build Anfang Juni 2026 angekündigte Small Language Model (SLM) Microsoft Aion 1.0 wird in einer kommenden Version des Browsers Edge nutzbar. Laut Microsoft soll es sogar mit CPU-Kernen auskommen. Das bisher genutzte „Schreibunterstützungs-API“ Phi-4-mini setzt demnach hingegen eine GPU mit mindestens 5,5 GByte VRAM voraus.


Mobilprozessor Nvidia RTX Spark alias N1X

Mobilprozessor Nvidia RTX Spark alias N1X

Mobilprozessor Nvidia RTX Spark alias N1X

(Bild: Florian Müssig / heise medien)

Außerdem steht die nächste Änderung an: Notebooks und Mini-Workstations mit dem ARM-Prozessor Nvidia RTX Spark. Bei dessen Ankündigung verlor Nvidia-Boss Jensen Huang kein Wort über eine eventuell ebenfalls integrierte NPU. Stattdessen betonte er, wie nicht anders zu erwarten, die KI-Fähigkeiten der GPU.

Im CPU-Teil des RTX Spark, den Kooperationspartner MediaTek besteuert, dürfte allerdings eine NPU stecken. Ob die beim RTX Spark aktiv ist, ist aber unklar.

Das Hin und Her von Microsoft bei Copilot+, also beim bevorzugten Hardware-Unterbau für KI-Apps, verwirrt nicht nur potenzielle Käufer von Notebooks und PCs. Den größeren Schaden richtete es als Bremsklotz für die Verbreitung von KI in Windows-Apps an. Denn KI braucht nun einmal viel Rechenleistung. Aber Entwickler schreckt es ab, wenn sie ihren Code mühselig an zahlreiche unterschiedliche KI-Rechenwerke anpassen müssen. Daher wäre eine klare Roadmap für KI-Unterstützung in Windows wichtig.

Dass KI-Funktionen auch bei Windows-Rechnern immer mehr an Bedeutung gewinnen, ist unstrittig. Nicht aber, ob sie in Zukunft auf CPU, GPU oder NPU laufen. Denn auch die IGP in einem Notebook-SoC kann KI-Berechnungen ausführen. Und falls sie entsprechend ausgelegt ist, taktet sie bei niedrigem Performancebedarf herunter, um effizienter zu rechnen.

Außerdem wollen sowohl AMD als auch Intel ihre CPU-Kerne in Zukunft um KI-Rechenwerke erweitern: „Advanced Matrix Extensions for Matrix Multiplication“ mit der nicht-intuitiven Abkürzung ACE. Der Qualcomm Snapdragon X2 hat die ARM Scalable Matrix Extension (SME). Eine ähnliche Funktion steckt in Apples M-Prozessoren ab dem M4.

Den Verweis auf Nicht-Copilot+-PCs erspähte die Website Windows Latest im GitHub-Repository des Windows App SDK 2.2 Experimental 9. Der Hinweis auf die Nvidia-GPU für Phi Silica findet sich in einer „Transparency Note“ von Microsoft.

Podcast Bit-Rauschen, Folge 2026/3 :


(ciw)



Source link

Weiterlesen

Künstliche Intelligenz

Google Brazos: Flüssigkeitskühlung für luftgekühlte Rechenzentren


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Google packt mit seinem neuen Kühlsystem Brazos ein wachsendes Problem in Rechenzentren an: Moderne Chips für künstliche Intelligenz und High-Performance Computing (HPC) überschreiten regelmäßig eine Thermal Design Power (TDP) von 1000 Watt. Herkömmliche Luftkühlung stößt bei dieser thermischen Last an ihre physikalischen Grenzen. Bisher blieb Betreibern oft nur der kostspielige und zeitintensive Umbau der Facility-Infrastruktur auf wassergekühlte Systeme.

Weiterlesen nach der Anzeige

Brazos soll diesen Prozess drastisch vereinfachen. Das System ist als Rack-basiertes, geschlossenes Liquid-to-Air-Modul konzipiert. Es erlaubt den Einsatz von flüssigkeitsgekühlter Hardware mit hoher Leistungsdichte in bestehenden, luftgekühlten Rechenzentrumsumgebungen. Statt das gesamte Gebäude aufwendig mit Kühlwasserkreisläufen auszustatten, lassen sich einzelne Racks modular nachrüsten. Laut Google ermöglicht dies eine One-rack-at-a-time-Strategie, bei der die Installation so unkompliziert wie bei Standard-Luftkühlungen bleibt.


Ein vertikales Rack mit mehreren Gasverteilungsmodulen und Verkabelung.

Ein vertikales Rack mit mehreren Gasverteilungsmodulen und Verkabelung.

(Bild: Google)

Technisch fungiert Brazos als geschlossene Kühleinheit, die Wärme direkt an den Komponenten aufnimmt und über hocheffiziente Wärmetauscher an den Warmgang des Rechenzentrums abgibt, wo sie von der vorhandenen Luftführung aufgenommen wird. Die Trennung zwischen dem IT-internen Kühlkreislauf und der Facility-Infrastruktur ist dabei der entscheidende Vorteil: Der Betreiber muss keine neuen Wasserleitungen durch das Gebäude verlegen.

Das Design ist auf den OCP-Standard ausgelegt. Das Open Compute Project ist eine 2011 von Facebook angestoßene, branchenweite Initiative, die offene Hardware-Spezifikationen für Rechenzentren entwickelt. Ziel ist es, durch standardisierte Designs die Effizienz zu steigern, Kosten zu senken und die Skalierbarkeit für Hyperscaler und Enterprise-Anwender zu verbessern.

Weiterlesen nach der Anzeige

Jede Brazos-Einheit belegt 11 Open Units (OU) an Rack-Höhe und ist für die Integration in OCP-ORv3-Racks optimiert. Ein voll ausgebautes System aus drei Einheiten unterstützt eine thermische Last von bis zu 60 Kilowatt pro Rack. Als Kühlmittel kommen wahlweise deionisiertes Wasser oder ein 25-prozentiges Propylenglykol-Gemisch (PG25) zum Einsatz. Die Energieversorgung erfolgt über einen 40- bis 60-Volt-Gleichstromanschluss, der direkt mit den Busbars des Racks verbunden wird.

Für den Betrieb ist zudem ein Monitoring integriert. Das System lässt sich lokal über ein Human-Machine-Interface (HMI) bedienen; für die Fernwartung steht ein Modbus-over-TCP-Protokoll bereit. Google hat bei der Konstruktion zudem auf die Wartungsfreundlichkeit geachtet. Die Einheiten sitzen auf Gleitschienen und lassen sich für Reparaturen leicht aus dem Rack ziehen. Pumpen und Lüfter sind als hot-swappable Field Replaceable Units (FRUs) konzipiert, was die durchschnittliche Reparaturzeit (MTTR) minimieren soll.

Google plant, die technischen Spezifikationen, Design-Prinzipien und visuellen Assets in den kommenden Monaten über die Foren des Open Compute Project öffentlich zugänglich zu machen. Anschließend lassen sich die Entwürfe evaluieren, um die Kühlung für künftige Hochleistungsrechner-Architekturen zu skalieren. Darüber hinaus ist das System bereits allgemein verfügbar; die Fertigungspartner sind laut Google bereit, die Brazos-Designs für den breiteren Markt zu produzieren und anzubieten. Technische Details finden Interessierte in der offiziellen Vorstellung von Brazos.


(fo)



Source link

Weiterlesen

Künstliche Intelligenz

Guter Jahrgang voraus: Apples 27er-Systeme und Siri AI | Mac & i-Podcast


Drei große und mehrere kleine Betriebssysteme hievt Apple im Herbst auf Version 27. Damit kommen Siri AI und schwerwiegende Änderungen an der viel diskutierten Liquid-Glass-Bedienoberfläche auf iPhones, Macs, iPads und Apple Watches. Zugleich verspricht Apple handfeste Leistungs- und Funktionsverbesserungen an vielen Ecken und Enden.

Weiterlesen nach der Anzeige

In Episode 124 knöpfen sich Malte Kirchner und Leo Becker die neuen Betriebssysteme im Detail vor – von iOS, macOS und iPadOS über watchOS, tvOS, visionOS bis audioOS. Wir tauschen erste konkrete Erfahrungen aus und diskutieren über die tiefgreifenden Änderungen an Liquid Glass, besonders in macOS 27. Uns beschäftigt außerdem der radikale Schnitt, mit dem Apple relativ junge Uhren wie die Ultra 1 ausklammert und wo die Reise für die Systeme insgesamt hingeht. Zum Schluss blicken wir auf Siri AI, die im Alltagseinsatz für allerhand Überraschungen sorgt.

Der Apple-Podcast von Mac & i erscheint mit dem Moderatoren-Duo Malte Kirchner und Leo Becker im Zweiwochenrhythmus und lässt sich per RSS-Feed (Audio) mit jeder Podcast-App der Wahl abonnieren – von Apple Podcasts über Overcast bis Pocket Casts.

Zum Anhören findet man ihn auch in Apples Podcast-Verzeichnis (Audio) und bei Spotify. Wir freuen uns über Feedback, Kritik und Fragen an podcast@mac-and-i.de.


(lbe)



Source link

Weiterlesen

Beliebt