Entwicklung & Code

Das Ende der Captchas – Agenten steuern Firefox per API wie ein Mensch


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Mozilla hat die TABS-API für Firefox angekündigt, über die Agenten den Browser steuern: durch Seiten klicken, Inhalte extrahieren und in JSON oder Markdown wandeln, Fragen beantworten sowie Formulare ausfüllen. Entwicklerinnen und Entwickler konzipieren darüber agentische Workflows oder simulieren menschliche Seitenbesuche zu Testzwecken.

Weiterlesen nach der Anzeige

Die API erledigt Aufgaben, die die Developer in natürlicher Sprache stellen. Laut Webseite ist dafür kein eigenes LLM erforderlich, allerdings ist der Dienst bis auf ein kleines Freivolumen kostenpflichtig. Für Interessenten steht derzeit eine Warteliste offen, wobei Mozilla noch keine Preise veröffentlicht hat; das Handling von Captchas und Proxies gibt es jedenfalls nur im kostenpflichtigen Paket Pay-as-you-go.

Entwickler können in der TABS-API vier Endpunkte ansteuern:

  • /Extract (POST): Liefert den Inhalt von Webseiten in JSON, Markdown oder einem anderen gewünschten Format
  • /Generate (GET): Transformiert Inhalte, zum Beispiel von Blog-Eintrag in Social-Media-Post
  • /Automate (GET): Komplexe, interaktive und agentengesteuerte Aufgaben
  • /Research (POST): Kontextorientierte Websuche mit Antwort

Mozilla betont, einen starken Fokus auf Datenminimierung und Sicherheit zu legen. Die API überträgt nur die nötigsten Daten per TLS Ende-zu-Ende verschlüsselt. Alle nicht mehr benötigten Daten löscht sie sofort.

Entwicklerinnen und Entwickler sprechen die TABS über Curl an oder sie bedienen sich eines von Mozilla bereitgestellten SDKs für TypeScript oder Python. Ein Beispiel für TypeScript liefert die Dokumentation:

Weiterlesen nach der Anzeige


import { Tabstack } from '@tabstack/sdk';

const tabs = new Tabstack({
  apiKey: process.env.TABSTACK_API_KEY!
});

// Access generate methods
tabs.generate.json(url, schema, instructions, options);



(who)



Source link

Beliebt

Die mobile Version verlassen