Apps & Mobile Entwicklung
Gemini 3.5 Flash: Google integriert Computersteuerung für KI-Agenten

Google integriert die bislang separat verfügbare Funktion „Computer Use“ nun nativ in Gemini 3.5 Flash. Entwickler können damit KI-Agenten erstellen, die Browser, mobile Anwendungen und Desktop-Programme selbstständig bedienen. Ergänzt wird die Integration durch Sicherheitsmechanismen für den Unternehmenseinsatz.
Wandel zu einer zentralen Plattform für KI-Agenten
Mit der nativen Integration von Computer Use will Google die Fähigkeiten von Gemini 3.5 Flash deutlich erweitert haben. Das KI-Modell kann dadurch grafische Benutzeroberflächen analysieren, Aufgaben planen und diese plattformübergreifend ausführen. Ein separates Computer-Use-Modell, wie es für Entwickler bislang lange Zeit auf Basis der Vorschau-Version von Gemini 2.5 erforderlich war, entfällt damit.
Mit dem Update entwickelt sich Gemini 3.5 Flash zunehmend weg von einem reinen Sprachmodell hin zu einer zentralen Plattform für agentische Anwendungen, mithilfe von Function Calling sowie den integrierten Werkzeugen für Google Search und Maps können KI-Agenten künftig direkt mit Benutzeroberflächen interagieren. Damit schafft Google die Grundlage für individuelle Automatisierungslösungen, die Informationen selbstständig erfassen, Entscheidungen treffen und Aktionen ausführen. Die eigentliche Ausführung erfolgt dabei weiterhin durch die Anwendung des Entwicklers.
Gemini 3.5 Flash wurde ursprünglich als leistungsfähiges und zugleich kosteneffizientes Modell für Programmierung und agentische Workflows entwickelt. Es unterstützt dabei ein Kontextfenster von bis zu einer Million Tokens sowie bis zu 65.000 Ausgabe-Tokens, zusätzlich können Entwickler verschiedene Denkstufen konfigurieren und damit zwischen einer höheren Genauigkeit, geringeren Kosten oder niedrigeren Antwortzeiten abwägen.
Zeitintensive Arbeiten an Agenten abgeben
Zu den von Google in der Vorstellung genannten Einsatzgebieten zählen unter anderem kontinuierliche Software-Tests, langfristige Automatisierungsprozesse sowie wissensintensive Unternehmensaufgaben über verschiedene professionelle Anwendungen hinweg. Insbesondere komplexe Enterprise-Workflows, aber auch wiederkehrende Büroaufgaben sollen von der Integration profitieren.
Google will Sicherheit ebenfalls erhöht haben
Mit den neuen Möglichkeiten autonomer Agenten wachsen naturgemäß auch die Risiken für Unternehmen, etwa durch Prompt-Injection-Angriffe. Diesen Gefahren will Google mit einer erweiterten Sicherheitsarchitektur begegnen. Dafür wurde Gemini 3.5 Flash speziell für Computer-Use-Szenarien durch gezieltes adversariales Training vorbereitet. Darüber hinaus wurden zwei weitere Schutzmechanismen eingeführt: Nutzer können verpflichtet werden, sensible oder nicht rückgängig zu machende Aktionen ausdrücklich zu bestätigen. Zudem lassen sich Arbeitsabläufe automatisch stoppen, wenn das System Anzeichen einer indirekten Prompt Injection erkennt.
Google empfiehlt darüber hinaus einen mehrschichtigen Sicherheitsansatz („Defense in Depth“). Dazu gehören isolierte Ausführungsumgebungen wie Sandboxing, menschliche Freigaben bei kritischen Schritten sowie streng kontrollierte Zugriffsrechte.