Apps & Mobile Entwicklung
Die Ratatouille-KI: Claude Code im Langzeittest – wo es vibed und wo es hakt
Agenten sind der aktuelle KI-Hype. Autonom komplexe Aufgaben erledigen ist das Versprechen. Was mit einem Agenten-System wie Claude Code oder Cowork derzeit möglich ist und welche Sicherheitsrisiken bestehen, analysiert ComputerBase. Ein Bericht über Erfahrungen aus einem über Wochen laufenden Langzeittest.
Der Anfang: Coding ohne Programmierer
Wie schnell sich Andrej Karpathys Einschätzung wandelte, ist bemerkenswert. Noch im Oktober 2025 erklärte der KI-Forscher und Ex-OpenAI-Mitarbeiter im Gespräch mit dem Podcaster Dwarkesh Patel, KI-Agenten seien nicht ausgereift genug. Sie funktionieren schlicht zu schlecht, um Menschen zu ersetzen. Über den Jahreswechsel hinweg beschrieb Karpathy auf X, wie abgehängt er sich mittlerweile als Programmierer fühlt.
Neue Modelle für die Agenten-Tools wie Anthropics Claude Code veränderten rasant den Workflow. Wie gravierend der Wandel ist, verdeutlicht Karpathy anhand des Anteils, den Agenten für ihn beim Coding übernehmen: Im November waren es noch 20 Prozent, im Dezember bereits 80 Prozent. Binnen Wochen erlebte er den gravierendsten Einschnitt in seiner Coding-Karriere.
This is easily the biggest change to my basic coding workflow in ~2 decades of programming and it happened over the course of a few weeks.
Andrej Karpathy
Allein steht er mit seinen Beobachtungen nicht. In der New York Times beschreibt der Entwickler und Startup-Gründer Manu Ebert, wie drei Agenten mittlerweile seinen klassischen Coder-Job übernehmen: Einer der KI-Assistenten programmiert, ein weiterer testet die Ergebnisse, ein dritter überwacht den Prozess. Statt von Programmieren ist in Silicon-Valley-Kreisen mittlerweile von „Agentic Engineering“ – also agentischer Software-Entwicklung – die Rede.
Der Wandel, der sich aktuell anbahnt, geht jedoch über das Coding hinaus. Sebastian Findeisen, Professor für Wirtschaftspolitik an der Universität Konstanz, erklärt im Rahmen eines Briefings des Science Media Center, dass die Agenten auch bald klassische Büroaufgaben übernehmen wie etwa „Rechnungen korrekt verbuchen, Haushaltsführung in Unternehmen oder einfache und schnelle Aufbereitung von Daten“. „Die Leute verstehen noch nicht, was auf sie zukommt“, ist die Einschätzung des Wetzlarer KI-Unternehmers Sven Herchenhein im Gespräch mit ComputerBase.
Es ist leicht, begeistert zu sein
Wenn man die Agenten selbst testet, springt der Funke schnell über. Es ist ein Gefühl wie im Film Ratatouille. Wenn sich Ideen für eine App in Prompt-Vorgaben übertragen lassen, die Python-Umgebung rotiert, man API-Key-Abrufe bestätigt und den Code auf GitHub hochlädt, fühlt es sich an, als säße einem die Ratte Remy auf den Schultern. Nur verhilft sie in diesem Fall nicht einem Küchenjungen zur Haute Cuisine, sondern völlig Unbedarften zu Coding-Erfolgen. Magische Momente.
Das Problem ist nur: Wenn Nutzer plötzlich Technik entwickeln können, ohne ein Gespür für Konsequenzen und Risiken zu haben, ist das auch etwa so charmant wie eine Ratte in einer Restaurantküche. Die technische Hygiene leidet enorm, Komplexität als Schutzmechanismus verschwindet.
ComputerBase testet Claude Code seit mehreren Wochen. Nach der ersten Begeisterung geht es vor allem um die Frage: Was bleibt auf Dauer? Öfter gab es schon den ChatGPT-Moment, bei dem der erste Eindruck eines neuen KI-Dienstes erstaunlich war, man aber in der Folge feststellte, dass es im Alltag doch noch hakt. Weil Fehler auftauchten. Oder weil Lösungen für Routine-Aufgaben so umständlich waren, dass man für das Prompten länger brauchte als für den eigentlichen Job.
Nun also der Erfahrungsbericht aus dem Alltagstest. ComputerBase analysiert, was man selbst mit den Agenten bewerkstelligen kann, wie die KI-Agenten bereits jetzt die Arbeitswelt verändern und welche Sicherheitsrisiken bestehen.
Wie funktioniert Claude Code
Um Claude Code nutzen zu können, benötigt man mindestens ein Pro-Abonnement, für das 20 US-Dollar im Monat fällig sind. Der primäre Zugang für Claude Code ist das Kommandozeilen-Interface (Command Line Interface, CLI). Die CLI-Version hat den Vorteil, dass Dateien und Ordner direkt auf dem Rechner bearbeitet werden können. Vorteile gibt es auch bei Automatisierungsroutinen und der Git-Integration. Sprich: Wer mit dem Agenten programmieren will, profitiert davon, wenn Claude Code in einem Terminal wie Windows PowerShell läuft. Mit reduziertem Funktionsumfang lässt sich der Agentenmodus aber auch über die Web- und Desktop-App von Claude nutzen.
Die Installation der CLI-Version von Claude Code ist simpel, die entsprechenden Befehle befinden sich auf der Webseite von Anthropic. Gibt es Probleme, reicht es in der Regel, diese beim Claude-Assistenten einzugeben. In der Desktop-App gibt es mit Cowork noch einen separaten Agenten-Modus, der sich explizit an Nutzer richtet, die nicht im Terminal arbeiten wollen. Dieser ist dann auch speziell für allgemeine Aufgaben wie Datenverarbeitung geeignet. Noch befindet sich Cowork im Betastatus und hat kleinere Macken. So kann dieser derzeit etwa nur auf Ordner zugreifen, die im Benutzerverzeichnis von Windows liegen.
Bemerkenswert bei dem KI-Agenten ist vor allem die Fähigkeit, dass dieser eigenständig Apps wie den Browser bedienen kann. Möglich ist das über Plugins wie beim Chrome-Browser oder die sogenannten Skills. Bei den Skills handelte es sich um vorgefertigte Pakete mit Skripten und Anweisungen, die den Agenten für bestimmte Aufgaben wie Excel-Arbeiten spezialisieren. Es ist also ein Set an maßgeschneiderten Werkzeugen, um Programme zu bedienen.
Alternativen zu Anthropics Agenten
Cowork gibt einen Ausblick auf die Zukunft. Während die CLI-Version von Claude Code noch vergleichsweise umständlich zu bedienen ist, werden sich die Agenten-Tätigkeiten künftig direkt in die Apps verlagern. OpenAI hat mit Codex ohnehin schon einen direkten Claude-Code-Konkurrenten. Künftig soll dieser mit ChatGPT zu einer Superapp werden. Mit Copilot Cowork hat Microsoft Anthropics Agenten bereits für die Windows-Welt adaptiert. Und Microsoft will Windows 11 ohnehin zum agentischen Betriebssystem umbauen.
Was die Pläne im Endeffekt bedeuten: Agenten werden in diesem Jahr im Alltag der meisten Nutzer auftauchen – sei es über die ChatGPT-App oder über Windows. Mit OpenClaw gibt es zudem den viel gehypten Open-Source-Agenten, den viele Hersteller nutzen wollen. AMD präsentiert den Ryzen AI Max+ als Plattform, um Agenten samt Modellen komplett lokal laufen zu lassen, während Nvidia NemoClaw als Umgebung für KI-PCs wie den DGX Spark (Test).
Bei diesem Test geht es aber zunächst nur um Claude Code. Anthropics Lösung bietet für den Einstieg die ausgereifteste Umgebung.