Entwicklung & Code
Das Ende der Captchas – Agenten steuern Firefox per API wie ein Mensch
Mozilla hat die TABS-API für Firefox angekündigt, über die Agenten den Browser steuern: durch Seiten klicken, Inhalte extrahieren und in JSON oder Markdown wandeln, Fragen beantworten sowie Formulare ausfüllen. Entwicklerinnen und Entwickler konzipieren darüber agentische Workflows oder simulieren menschliche Seitenbesuche zu Testzwecken.
Weiterlesen nach der Anzeige
Die API erledigt Aufgaben, die die Developer in natürlicher Sprache stellen. Laut Webseite ist dafür kein eigenes LLM erforderlich, allerdings ist der Dienst bis auf ein kleines Freivolumen kostenpflichtig. Für Interessenten steht derzeit eine Warteliste offen, wobei Mozilla noch keine Preise veröffentlicht hat; das Handling von Captchas und Proxies gibt es jedenfalls nur im kostenpflichtigen Paket Pay-as-you-go.
Entwickler können in der TABS-API vier Endpunkte ansteuern:
- /Extract (POST): Liefert den Inhalt von Webseiten in JSON, Markdown oder einem anderen gewünschten Format
- /Generate (GET): Transformiert Inhalte, zum Beispiel von Blog-Eintrag in Social-Media-Post
- /Automate (GET): Komplexe, interaktive und agentengesteuerte Aufgaben
- /Research (POST): Kontextorientierte Websuche mit Antwort
Mozilla betont, einen starken Fokus auf Datenminimierung und Sicherheit zu legen. Die API überträgt nur die nötigsten Daten per TLS Ende-zu-Ende verschlüsselt. Alle nicht mehr benötigten Daten löscht sie sofort.
SDKs für TypeScript und Python
Entwicklerinnen und Entwickler sprechen die TABS über Curl an oder sie bedienen sich eines von Mozilla bereitgestellten SDKs für TypeScript oder Python. Ein Beispiel für TypeScript liefert die Dokumentation:
Weiterlesen nach der Anzeige
import { Tabstack } from '@tabstack/sdk';
const tabs = new Tabstack({
apiKey: process.env.TABSTACK_API_KEY!
});
// Access generate methods
tabs.generate.json(url, schema, instructions, options);
(who)