Entwicklung & Code

KI-Desktop im Browser von Anthropic: Anwendungen gestalten mit Prompts


Das KI-Start-up Anthropic hat diese Woche nicht nur sein Modell Claude Sonnet 4.5 veröffentlicht, sondern auch ein experimentelles Feature vorgestellt: Imagine with Claude. Die virtuelle Desktop-Umgebung können Nutzerinnen und Nutzer per KI-Chat umgestalten und Anwendungen darauf allein per Texteingabe erzeugen – Software, die im Moment des Bedarfs entsteht, statt im Vorfeld programmiert zu werden.

Die Technologie-Vorschau läuft nur fünf Tage und steht ausschließlich zahlenden Abonnenten von Claude Max zur Verfügung. Für alle anderen gibt es nur ein Video auf YouTube:

Anthropic selbst bezeichnet das Ganze als Machbarkeitsstudie. Dennoch zeigt sich schon jetzt, wie KI-gestützte Softwareentwicklung künftig aussehen könnte.

Nach Aktivierung öffnet sich eine Browser-basierte Desktop-Oberfläche mit Icons, Fenstern und Papierkorb. Jede Eingabe kann zur spontanen Erstellung einer Anwendung führen. Anders als bei klassischen Tools liegen Funktionen nicht fertig vor, sondern Claude generiert den nötigen Code bei jeder Interaktion. Die KI weiß, dass sie eine Webseite steuert, kennt aber zu Beginn keine Details über deren Inhalte.



Die Desktop-Oberfläche von Imagine with Claude läuft im Browserfenster. Unten findet sich das Chat-Feld.

Im unteren Bereich befindet sich das Eingabefeld. Auf den Befehl „Remove the yellow notes from the desktop“ zeigt Claude beim Arbeiten seine internen Überlegungen an, sucht mögliche Selektoren und löscht anschließend die Notizen.

The user wants to remove yellow notes from the desktop. I need to look for elements that represent yellow notes/sticky notes on the desktop and remove them.
However, I don’t have any information about the current state of the DOM or what elements exist on the desktop. The user is asking me to remove something, but I need to know what selector to use.
Since this is the first interaction and I don’t have context about what’s on the screen, I should ask for clarification or try common selectors for note elements. But the instruction says „Answer the user’s request using the relevant tool(s)“ – so I should try to remove elements that might be yellow notes.
Common selectors for notes might be: – Elements with class „note“ or „sticky-note“ or „yellow-note“ – Elements with id containing „note“ – Elements with specific background colors
But I don’t actually know what’s on the screen. The user said „Remove the yellow notes from the desktop“ – this implies there ARE yellow notes currently visible that they want removed.
Since I don’t have the current DOM state, I should try common selectors. Let me try: – .note (common class name) – .sticky-note – [class*=“note“]
Actually, looking at the system prompt again – it says the user is seeing HTML progressively and I’m reacting to their actions. This suggests there might already be content on the page that I created or that exists.
Since I don’t have visibility into what’s currently on screen, I’ll try to remove elements with common note-related selectors. If they don’t exist, the tool will simply not find anything to remove.
Let me try removing elements with class „note“ or similar. dom_remove dom_remove dom_remove Done Context: [█░░░░░░░░░░░] 15k/100k (15%)

Das klappt aber nicht immer so gut. Wiederholt man den Test mit einem frischen Desktop, scheitert die KI teils an dieser vergleichsweise einfachen Aufgabe.

Auch der verfügbare Kontext ist mit 100k Token begrenzt. Ist der Speicher voll, hilft nur ein Neustart unter claude.ai/imagine. Dort lässt sich etwa im nächsten Versuch mit „Open a terminal“ ein Terminalfenster öffnen, in dem Befehle wie ls funktionieren. Dateien und Verzeichnisse sind nicht real, stattdessen generiert Imagine sie dynamisch – samt Darstellung im Finder. Dabei simuliert Claude das komplette Desktop-System. Wenn man im Terminalfenster eine Datei anlegt, ändert oder löscht, dann sieht man parallel im Finder-Fenster die Auswirkungen dieser Befehle.



Änderungen, die Anwender im Terminalfenster machen, erscheinen auch im Dateimanager.

Ein weiteres Beispiel: Auf die Eingabe „Erstelle eine Datenbank mit den Lottozahlen der letzten 10 Jahre“ startet Claude selbstständig eine Internetrecherche und sammelt die Daten, um sie in einer neuen Applikation anzuzeigen. Mit Prompt-Eingaben kann man diese Applikation um Feature-Requests wie „Zeige die am meisten gezogenen Zahlen“ erweitern. Wenn man auf Elemente der Applikation klickt, überlegt sich Claude, wie die Applikation auf diesen Klick reagiert und zeigt das dann an. Unterschiedliche Applikationen können innerhalb des gleichen Kontexts Daten austauschen.



Für die Lottozahlen-Datenbank startet Claude selbsttätig eine Internetrecherche.

Bugs entstehen und Anwender müssen sie mit neuen Prompts geradeziehen. Eine digitale Uhr konnte ich mit einem Prompt erzeugen. Eine analoge Uhr benötigte drei weitere Eingaben, bis sie funktionierte.

Möglich macht das Claude Sonnet 4.5 in Kombination mit einer Agenten-basierten Steuerung der UI. Im Hintergrund arbeitet ein Werkzeugkasten mit Befehlen wie WINDOW NEW oder DOM REPLACE HTML. Claude generiert und testet Code in einer Sandbox-ähnlichen Umgebung, um die gewünschte Funktionalität umzusetzen. Bei komplexeren Interaktionen entstehen dabei spürbare Verzögerungen.

Die Einsatzmöglichkeiten reichen vom Rapid Prototyping über kleine Hilfs-Apps bis hin zur Vision eines KI-Betriebssystems.

Offen bleiben allerdings zentrale Fragen: Stabilität, Sicherheit und Verlässlichkeit einer KI, die direkt Code ausführt. Laut Anthropic ist Claude 4.5 stärker auf Sicherheit (Alignment) trainiert und mit Schutzmechanismen gegen Missbrauch ausgestattet.

Während Bildgeneratoren wie Midjourney oder DALL·E 3 Medieninhalte erzeugen, zielt Anthropic klar auf Softwareerstellung. Damit unterscheidet sich der Ansatz auch von OpenAIs jüngsten Erweiterungen, die stärker in Richtung allgemeiner Assistenten gehen.

Ein ähnliches Konzept liegt dem Firebase Studio von Google zugrunde. Ebenfalls im Browser gestalten die Nutzer Anwendungen per Sprachbefehl, während sie die Ergebnisse live im selben Fenster sehen. Allerdings dient das Tool der Entwicklung von Webanwendungen und es wirkt mehr wie ein WYSWYG-Editor als ein Desktop.

Virtuelle Desktops im Browser sind keine neue Idee: Schon Ende der 1990er experimentierte Netscape-Gründer Marc Andreessen damals in Java mit vergleichbaren Konzepten. Wirklich durchgesetzt haben sie sich jedoch nie. Imagine with Claude geht nun einen Schritt weiter und stellt das Prinzip klassischer Softwareverteilung infrage: Programme werden nicht installiert, sondern ad hoc durch Spracheingaben erzeugt.

Auch wenn es sich nur um eine kurze Vorschau handelt, liefert das Experiment einen faszinierenden Ausblick – und dürfte die Debatte um KI-generierte Software weiter anheizen.


(who)



Source link

Beliebt

Die mobile Version verlassen