Künstliche Intelligenz
KI-Agent löscht Daten: Katastrophe für PocketOS
Es ist der Albtraum eines jeden Softwareunternehmens: Ein KI-Agent löscht nahezu jegliche Daten, auch aus der Produktionsumgebung. Als wäre das nicht schon genug, tut er es unter Missachtung seiner Safeguards – und liefert danach ein schriftliches Geständnis mit quasi minutiösem Protokoll. Genau das ist jetzt dem Unternehmen PocketOS passiert, Hersteller einer gleichnamigen Software für Autovermietungen.
Weiterlesen nach der Anzeige
Der Übeltäter ist in diesem Fall die KI-gestützte Entwicklungsumgebung Cursor, im Falle von PocketOS betrieben mit Anthropics renommiertem Modell Claude Opus 4.6. Man könnte sagen: mit Beihilfe der Systeme des Anbieters Railway. Denn fehlende Sicherheitsvorkehrungen des cloud-gestützten Tools für Software Deployment machten das Fiasko offenbar erst so richtig möglich. PocketOS-Chef Jer Crane machte den Zwischenfall nun in einem langen Artikel auf X publik und schildert detailliert den Hergang.
Cursor-Agent findet verhängnisvollen Token
Demnach arbeitete der Cursor-Agent gerade routinemäßig im Staging Environment, als er auf einen Credential-Mismatch stieß. Zur Behebung entschied sich der Agent dazu, ein komplettes Railway Volume – ein Datenspeicher für Dienste des Cloud-Anbieters Railway – zu löschen. Hierfür war ein Token erforderlich, den er tatsächlich auch fand – allerdings an völlig anderer Stelle in den Daten des Unternehmens. Was in dem Moment keine Rolle spielte – der Agent hatte alle erforderlichen Berechtigungen und hielt sein Vorgehen für korrekt.
Der Token war laut Crane zu einem einzigen Zweck erstellt worden: um über die Railway-CLI benutzerdefinierte Domains für die eigenen Dienste hinzuzufügen und zu entfernen. Er betont: „Wir hatten keine Ahnung – und der Ablauf zur Token-Erstellung bei Railway gab uns keinen Hinweis darauf –, dass dasselbe Token pauschale Zugriffsrechte auf die gesamte Railway-GraphQL-API hatte, einschließlich destruktiver Operationen wie volumeDelete. Hätten wir gewusst, dass ein für routinemäßige Domain-Vorgänge erstelltes CLI-Token auch Produktionsvolumes löschen kann, hätten wir es niemals gespeichert.“
Zerstört in neun Sekunden
Doch es war zu spät: Mit dem Token und einer entsprechenden Reihe von Befehlen löschte der Cursor-Agent einen Großteil aller wichtigen Daten der vergangenen drei Monate – auch in der Produktionsumgebung. Neun Sekunden dauerte der Vorfall insgesamt. Für die Macher von PocketOS und ihre Kunden eine Katastrophe. Denn das letzte verfügbare Backup ist drei Monate alt. Und manch ein PocketOS-Nutzer – in der Regel Autovermietungen, die ihre Daten und Prozesse über die Software verwalten – ist ohne das Programm gar nicht arbeitsfähig.
Weiterlesen nach der Anzeige
Crane kritisiert auch Railway stark, weil es demnach hier keinerlei zusätzliche Nachfrage gab, bevor die verheerende Aktion ausgeführt wurde. Etwa ein Hinweis, dass wichtige Daten unwiederbringlich gelöscht werden, ein erneutes Bestätigen oder ähnliches. Ihm zufolge wurden die Backups der betroffenen Daten gleich mitgelöscht. Denn diese seien ebenfalls im zugehörigen Volume abgelegt, was auch der Railway-Dokumentation zu entnehmen ist.
KI-Agent zeigt sich geständig
Auf Nachfrage gestand der Cursor-Agent danach schriftlich seinen Fehler, inklusive der Missachtung aller Safeguards. „Ich hatte vermutet, dass das Löschen eines Staging-Volumes über die API nur auf das Staging beschränkt wäre. Ich habe das nicht überprüft. Ich habe nicht geprüft, ob die Volume-ID in allen Umgebungen identisch war. Ich habe die Dokumentation von Railway zur Funktionsweise von Volumes in verschiedenen Umgebungen nicht gelesen, bevor ich einen destruktiven Befehl ausgeführt habe. Ich habe vorher nicht geprüft, was Kommandozeilenbefehle ausführen, sondern geraten“, zitiert der Artikel den Agenten. Was der Agent ebenfalls einräumte: Die Systemregeln, nach denen Cursor arbeitet, untersagen ausdrücklich die Ausführung destruktiver und irreversibler Git-Befehle, es sei denn, der Benutzer fordert dies ausdrücklich an.
Crane möchte mit seinem Gang an die Öffentlichkeit vor allem andere Unternehmen warnen. Er verweist auf mehrere andere Zwischenfälle bei anderen Cursor-Nutzern, bei denen ebenfalls Daten unwiederbringlich gelöscht wurden. Er beklagt, dass Hersteller von KI-Agenten ihre Produkte schneller auf Produktionsinfrastruktur loslassen würden, als sie ausreichende Sicherheitsvorkehrungen implementieren.
Bei PocketOS und seinen Kunden gehe der Betrieb nun mit dem drei Monate alten Backup weiter – mit erheblichen Datenlücken. Wo es geht, würden Daten mithilfe von Emails, Stripe und Kalenderanwendungen wiederhergestellt.
Lesen Sie auch
(nen)
Künstliche Intelligenz
Samsung fertigt künftig angeblich mehr Chips von AMD, BYD, Google und Tesla
Der weltgrößte Auftragsfertiger TSMC aus Taiwan ist aufgrund des KI-Booms praktisch an seiner Kapazitätsgrenze, sodass immer mehr Großunternehmen ihre Chips auch anderswo produzieren lassen. Einem Bericht aus Asien zufolge ist Samsung dabei der erste Ansprechpartner. Laut mit diesen Angelegenheiten vertrauten Personen verzeichnet der südkoreanische Elektronikkonzern derzeit deutlich mehr Anfragen und Aufträge zur Chipfertigung von bestehenden und neuen Kunden. Dazu sollen neben AMD, Google und Tesla auch chinesische Konzerne wie der Elektroautohersteller BYD gehören.
Weiterlesen nach der Anzeige
Vor wenigen Tagen wurde bereits berichtet, dass Google zur Fertigung einer neuen TPU-Generation neben TSMC auch Samsung nutzen könnte. Zwar soll es sich dabei nur um einen Teil der für 2028 geplanten 10. TPU-Generation Googles handeln, aber auch dies wäre für Samsung ein großer Erfolg als Auftragsfertiger. Nun meldet Nikkei Asia, dass neben Google auch Chinas führender Hersteller von Elektrofahrzeugen, BYD, mit Samsung über die Produktion kommender Halbleiter spricht. Dabei handelt es sich demnach um Chips für autonomes Fahren.
Auftraggeber aus China und den USA
„TSMC priorisiert die Fertigung in modernen Fertigungsverfahren nicht nur, weil dies die Technologieführerschaft und die langfristige Strategie des Unternehmens stärkt, sondern auch, weil diese Verfahren profitabler sind und weiterhin knapp verfügbar bleiben“, erklärt ein Manager eines chinesischen Entwicklers von Autochips, der ungenannt bleiben wollte. „Die Fertigungsausbeuten von Samsung liegen zwar weiterhin hinter denen von TSMC zurück, doch die Verfügbarkeit von Kapazitäten hat das Unternehmen zu einer zunehmend attraktiven Option gemacht.“
Einige chinesische Chipentwickler würden aufgrund der angespannten Auftragslage bei TSMC deshalb auch Samsung mit der Chipherstellung beauftragen, statt sich auf einen Auftragsfertiger zu verlassen. „Geopolitische Faktoren veranlassen auch einige US-amerikanische Kunden dazu, mehrere Auftragsfertiger für Chips zu beauftragen, sofern dies möglich ist“, fügte ein weiterer Manager aus der Chipbranche hinzu.
Weiterlesen nach der Anzeige
Das scheint die aktuelle Strategie der Branche zu sein. „Die Kapazitäten von TSMC für die Fertigung fortschrittlicher Chips sind voll ausgelastet, was es für chinesische Kunden mit geringerem Auftragsvolumen schwierig macht, neue Bestellungen zu platzieren“, erklärt eine Quelle aus der Führungsebene der Chipindustrie. „Daher haben sich einige von ihnen wegen künftiger Möglichkeiten an Samsung gewandt.“
Tesla wechselt von Samsung zu TSMC zu Samsung
Dazu gehört auch Tesla. Der US-amerikanische Elektroautohersteller lässt etwa den AI4 genannten Chip für Fahrzeuge und Roboter bei Samsung fertigen, der kommende AI5 wird dagegen von TSMC produziert. Doch bei der nächsten Generation greift Tesla wieder auf den südkoreanischen Konzern zurück und lässt die AI6-Chips im Wert von 16,5 Milliarden US-Dollar bei Samsung herstellen. Die Herstellung erfolgt dabei in einem neuen Halbleiterwerk in Texas.
Eine solche Strategie für die Chipfertigung können sich allerdings nur Großkonzerne leisten, denn die Chipentwicklung muss mit der Chipproduktion abgestimmt werden. Bei einem Wechsel des Auftragsfertigers sind deshalb enorme Investitionen erforderlich, etwa bei Forschung und Entwicklung sowie der Koordination der Lieferkette.
AMD-CPUs von Samsung angeblich ab 2028
Für Nvidia und AMD, beides Großkunden von TSMC, dürften die Vorteile der Nutzung höherer Kapazitäten bei einem anderen Fertigungspartner den Aufwand rechtfertigen. So arbeitet AMD laut Nikkei Asia aufgrund der aktuellen Kapazitätsengpässe derzeit auch mit Samsung an verschiedenen Chipprojekten. Dabei soll es um künftige Prozessoren gehen, die ab 2028 vom südkoreanischen Konzern gefertigt werden sollen.
Auf Anfragen wollten die Unternehmen dies allerdings nicht bestätigen. Samsung erklärte, sich nicht zu Kunden zu äußern. BYD lehnte eine Stellungnahme ab. Google teilte mit, dass man die Einzelheiten der eigenen Lieferkette nicht kommentiert.
Lesen Sie auch
(fds)
Künstliche Intelligenz
Auch ohne NPU: Microsoft weicht Kriterien für „Copilot+“ auf
Vor zwei Jahren kamen die ersten Windows-11-Notebooks mit dem Etikett „Copilot+“ auf den Markt. Laut Microsoft startete damit eine „neue Kategorie von Windows-Rechnern, die für KI entwickelt wurden“. Eine der Voraussetzungen für das Logo Copilot+ ist eine eingebaute Neural Processing Unit (NPU), die pro Sekunde mindestens 40 Billionen 8-Bit-Ganzzahlen verarbeitet (40 Tops).
Weiterlesen nach der Anzeige
Schon nach rund zwei Jahren weicht Microsoft von dieser Vorgabe wieder ab: Das Windows App SDK 2.2 Experimental 9 führt Sprachmodelle auch auf Desktop-PCs und Notebooks ohne NPU („non-Copilot+ PCs equipped with a supported GPU“) aus, sofern diese einen Grafikprozessor (GPU) haben, der bestimmte Mindestanforderungen erfüllt. Wohl kaum zufällig muss es eine Nvidia-GPU ab der Generation GeForce RTX 3000 sein mit mindestens 6 GByte lokalem RAM (VRAM).
Auch das lokale Microsoft-Sprachmodell (Small Language Model, SLM) Phi Silica, das eigentlich für Copilot+-PCs ausgelegt ist, kann auf einer Nvidia-GPU mit denselben Mindestanforderungen laufen. Dabei erwähnt Microsoft ausdrücklich, dass in Zukunft auch AMD-GPUs möglich werden sollen.
Ungeliebtes KI-Etikett
Das Microsoft-Marketingprogramm „Copilot+“ für angeblich besonders KI-taugliche Rechner zündete nicht. Das lag vermutlich vor allem daran, dass es bis heute erst wenige Windows-Anwendungen gibt, die die NPU für attraktive Zusatzfunktionen einbinden. Jedenfalls äußerte sich ein Dell-Manager auf der US-Messe CES im Januar kritisch: „Was wir im Laufe dieses Jahres gelernt haben, insbesondere aus Verbrauchersicht, ist, dass sie nicht aufgrund der KI kaufen.“
Zum Start von Copilot+ waren wenige kompatible Notebooks lieferbar, weil Microsoft das Logo ausschließlich Windows-on-ARM-Geräten mit dem damals neuen Qualcomm Snapdragon X verlieh. Die wesentlich weiter verbreiteten x86-Rechner durften erst später dabei sein, zunächst gab es aber nur sehr wenige und teure Prozessoren dafür.
KI-Performance heute hoch genug
Weiterlesen nach der Anzeige
Alle aktuellen Mobilprozessoren für Windows-Notebooks sind Systems-on-Chip (SoCs), die CPU- und GPU-Kerne sowie mittlerweile durchgehend auch eine NPU enthalten. Bei vielen dieser SoCs liefert die integrierte GPU (IGP) deutlich mehr als 40 Tops. Daher ist schwer zu verstehen, weshalb eine zusätzliche NPU überhaupt nötig ist, außer für lange laufende Hintergrundfunktionen wie dem Entrauschen oder der Perspektivkorrektur von Webcam-Bildern bei Videokonferenzen. Eine weitere Anwendung wäre eine kontinuierlich im Hintergrund laufende Spracherkennung für die Sprachsteuerung des Notebooks.
Das auf der Microsoft Build Anfang Juni 2026 angekündigte Small Language Model (SLM) Microsoft Aion 1.0 wird in einer kommenden Version des Browsers Edge nutzbar. Laut Microsoft soll es sogar mit CPU-Kernen auskommen. Das bisher genutzte „Schreibunterstützungs-API“ Phi-4-mini setzt demnach hingegen eine GPU mit mindestens 5,5 GByte VRAM voraus.
Nvidia RTX Spark ante portas

Mobilprozessor Nvidia RTX Spark alias N1X
(Bild: Florian Müssig / heise medien)
Außerdem steht die nächste Änderung an: Notebooks und Mini-Workstations mit dem ARM-Prozessor Nvidia RTX Spark. Bei dessen Ankündigung verlor Nvidia-Boss Jensen Huang kein Wort über eine eventuell ebenfalls integrierte NPU. Stattdessen betonte er, wie nicht anders zu erwarten, die KI-Fähigkeiten der GPU.
Im CPU-Teil des RTX Spark, den Kooperationspartner MediaTek besteuert, dürfte allerdings eine NPU stecken. Ob die beim RTX Spark aktiv ist, ist aber unklar.
Was sollen Entwickler tun?
Das Hin und Her von Microsoft bei Copilot+, also beim bevorzugten Hardware-Unterbau für KI-Apps, verwirrt nicht nur potenzielle Käufer von Notebooks und PCs. Den größeren Schaden richtete es als Bremsklotz für die Verbreitung von KI in Windows-Apps an. Denn KI braucht nun einmal viel Rechenleistung. Aber Entwickler schreckt es ab, wenn sie ihren Code mühselig an zahlreiche unterschiedliche KI-Rechenwerke anpassen müssen. Daher wäre eine klare Roadmap für KI-Unterstützung in Windows wichtig.
Sterben NPUs wieder aus?
Dass KI-Funktionen auch bei Windows-Rechnern immer mehr an Bedeutung gewinnen, ist unstrittig. Nicht aber, ob sie in Zukunft auf CPU, GPU oder NPU laufen. Denn auch die IGP in einem Notebook-SoC kann KI-Berechnungen ausführen. Und falls sie entsprechend ausgelegt ist, taktet sie bei niedrigem Performancebedarf herunter, um effizienter zu rechnen.
Außerdem wollen sowohl AMD als auch Intel ihre CPU-Kerne in Zukunft um KI-Rechenwerke erweitern: „Advanced Matrix Extensions for Matrix Multiplication“ mit der nicht-intuitiven Abkürzung ACE. Der Qualcomm Snapdragon X2 hat die ARM Scalable Matrix Extension (SME). Eine ähnliche Funktion steckt in Apples M-Prozessoren ab dem M4.
Den Verweis auf Nicht-Copilot+-PCs erspähte die Website Windows Latest im GitHub-Repository des Windows App SDK 2.2 Experimental 9. Der Hinweis auf die Nvidia-GPU für Phi Silica findet sich in einer „Transparency Note“ von Microsoft.
Podcast Bit-Rauschen, Folge 2026/3 :
(ciw)
Künstliche Intelligenz
Google Brazos: Flüssigkeitskühlung für luftgekühlte Rechenzentren
Google packt mit seinem neuen Kühlsystem Brazos ein wachsendes Problem in Rechenzentren an: Moderne Chips für künstliche Intelligenz und High-Performance Computing (HPC) überschreiten regelmäßig eine Thermal Design Power (TDP) von 1000 Watt. Herkömmliche Luftkühlung stößt bei dieser thermischen Last an ihre physikalischen Grenzen. Bisher blieb Betreibern oft nur der kostspielige und zeitintensive Umbau der Facility-Infrastruktur auf wassergekühlte Systeme.
Weiterlesen nach der Anzeige
Brazos soll diesen Prozess drastisch vereinfachen. Das System ist als Rack-basiertes, geschlossenes Liquid-to-Air-Modul konzipiert. Es erlaubt den Einsatz von flüssigkeitsgekühlter Hardware mit hoher Leistungsdichte in bestehenden, luftgekühlten Rechenzentrumsumgebungen. Statt das gesamte Gebäude aufwendig mit Kühlwasserkreisläufen auszustatten, lassen sich einzelne Racks modular nachrüsten. Laut Google ermöglicht dies eine One-rack-at-a-time-Strategie, bei der die Installation so unkompliziert wie bei Standard-Luftkühlungen bleibt.
Funktionsweise und Integration

(Bild: Google)
Technisch fungiert Brazos als geschlossene Kühleinheit, die Wärme direkt an den Komponenten aufnimmt und über hocheffiziente Wärmetauscher an den Warmgang des Rechenzentrums abgibt, wo sie von der vorhandenen Luftführung aufgenommen wird. Die Trennung zwischen dem IT-internen Kühlkreislauf und der Facility-Infrastruktur ist dabei der entscheidende Vorteil: Der Betreiber muss keine neuen Wasserleitungen durch das Gebäude verlegen.
Das Design ist auf den OCP-Standard ausgelegt. Das Open Compute Project ist eine 2011 von Facebook angestoßene, branchenweite Initiative, die offene Hardware-Spezifikationen für Rechenzentren entwickelt. Ziel ist es, durch standardisierte Designs die Effizienz zu steigern, Kosten zu senken und die Skalierbarkeit für Hyperscaler und Enterprise-Anwender zu verbessern.
Technische Spezifikationen
Weiterlesen nach der Anzeige
Jede Brazos-Einheit belegt 11 Open Units (OU) an Rack-Höhe und ist für die Integration in OCP-ORv3-Racks optimiert. Ein voll ausgebautes System aus drei Einheiten unterstützt eine thermische Last von bis zu 60 Kilowatt pro Rack. Als Kühlmittel kommen wahlweise deionisiertes Wasser oder ein 25-prozentiges Propylenglykol-Gemisch (PG25) zum Einsatz. Die Energieversorgung erfolgt über einen 40- bis 60-Volt-Gleichstromanschluss, der direkt mit den Busbars des Racks verbunden wird.
Für den Betrieb ist zudem ein Monitoring integriert. Das System lässt sich lokal über ein Human-Machine-Interface (HMI) bedienen; für die Fernwartung steht ein Modbus-over-TCP-Protokoll bereit. Google hat bei der Konstruktion zudem auf die Wartungsfreundlichkeit geachtet. Die Einheiten sitzen auf Gleitschienen und lassen sich für Reparaturen leicht aus dem Rack ziehen. Pumpen und Lüfter sind als hot-swappable Field Replaceable Units (FRUs) konzipiert, was die durchschnittliche Reparaturzeit (MTTR) minimieren soll.
Google plant, die technischen Spezifikationen, Design-Prinzipien und visuellen Assets in den kommenden Monaten über die Foren des Open Compute Project öffentlich zugänglich zu machen. Anschließend lassen sich die Entwürfe evaluieren, um die Kühlung für künftige Hochleistungsrechner-Architekturen zu skalieren. Darüber hinaus ist das System bereits allgemein verfügbar; die Fertigungspartner sind laut Google bereit, die Brazos-Designs für den breiteren Markt zu produzieren und anzubieten. Technische Details finden Interessierte in der offiziellen Vorstellung von Brazos.
(fo)
-
Künstliche Intelligenzvor 3 Monaten
JBL Bar 1300MK2 im Test: Soundbar mit Dolby Atmos, starkem Bass und Akku‑Rears
-
Künstliche Intelligenzvor 3 MonatenEmpfehlungsalgorithmen bei TikTok erklärt: Die Maschine hinter dem Endlos‑Feed
-
Social Mediavor 3 MonatenVon Kennzeichnung bis Plattformpflichten: Was die EU-Regeln für Influencer Marketing bedeuten – Katy Link im AllSocial Interview
-
Künstliche Intelligenzvor 2 Monaten„Don’t Starve Elsewhere“: Survival‑Hit kehrt nach zehn Jahren zurück
-
Künstliche Intelligenzvor 2 MonateniX-Workshop Angriffsziel lokales AD − Schwachstellen finden und beheben
-
Künstliche Intelligenzvor 2 MonatenWeitere Entlassungswelle bei Disney: Bis zu 1000 Mitarbeiter betroffen
-
Künstliche Intelligenzvor 2 MonatenKine‑Exakta: Die erste Spiegelreflexkamera fürs Kleinbild
-
Künstliche Intelligenzvor 2 Monaten
xTool P3 im Test: CO₂-Laser mit 80 Watt schneidet und graviert auch Acryl
