Entwicklung & Code

Nachruf: Abschied von robots.txt (1994-2025)

Henning Fries ist UI/UX-Engineer mit Leidenschaft für nachhaltiges Webdesign, digitale Barrierefreiheit und die Psychologie guter Nutzererlebnisse.
Seit über fünfzehn Jahren arbeitet er als Designer, Entwickler und Berater an der Schnittstelle von Mensch, Technologie und Gestaltung – in Deutschland, Frankreich und Luxemburg.
Als Full-Stack-Entwickler mit Designfokus und Green-Frontend-Enthusiast verbindet er technisches Know-how mit einem klaren Bewusstsein für Ressourcenschonung und User Experience. Sein Ziel: digitale Produkte, die sinnvoll, zugänglich und menschlich sind.

Mit tiefer Trauer geben wir das Ende von robots.txt bekannt, der bescheidenen Textdatei, die dreißig Jahre lang als stille Wächterin der digitalen Höflichkeit diente. Geboren am 1. Februar 1994 aus der Not heraus, als Martijn Kosters Server unter einem fehlerhaften Crawler namens „Websnarf“ zusammenbrach, verstarb robots.txt im Juli 2025, nicht durch Cloudflares Hand, sondern an den Folgen systematischer Missachtung durch KI-Konzerne. Cloudflares Entscheidung, KI-Crawler standardmäßig zu blockieren, markierte lediglich den Moment, in dem auch der letzte große Infrastruktur-Anbieter das Vertrauen in freiwillige Compliance aufgab und zu technischer Durchsetzung überging – ein letzter Akt der Verzweiflung, der das Ende einer Ära markierte. Wie bei allen bedeutsamen Verlusten brauchte es Zeit, bis das volle Ausmaß dieser digitalen Tragödie begriffen wurde.

Weiterlesen nach der Anzeige

Ein Leben der stillen Dienste

robots.txt wurde in einer Zeit geboren, in der das Internet einer kleinen, beschaulichen Nachbarschaft glich – überschaubar, persönlich und geprägt von gegenseitigem Vertrauen. Man kannte die Bots, die vorbeikamen, und pflegte den digitalen Umgang miteinander. robots.txt, geborene „RobotsNotWanted.txt“, war nie darauf ausgelegt, komplexe rechtliche Schlachten zu führen oder Milliardenunternehmen zu konfrontieren – sie war einfach ein höflicher, aber dennoch bestimmter Hinweis: „Bitte nicht hier entlang.“

In ihren goldenen Jahren lebte robots.txt in perfekter Harmonie mit den großen Suchmaschinen. Google respektierte sie, Yahoo ehrte sie, und selbst AltaVista – ruhe in Frieden – und Lycos folgten ihren Anweisungen. Es war ein Geben und Nehmen. Es war eine Freundschaft auf Augenhöhe, geprägt von einer einfachen Wahrheit: Suchmaschinen erhielten Content zur Indexierung, während Websites im Gegenzug Traffic bekamen. Dieses Crawl-zu-Referral-Verhältnis – also das Verhältnis zwischen Bot-Zugriffen und zurückgeleiteten Nutzern – lag bei Google bei einem fairen 14:1. Pro 14 von Bots aufgerufenen Seiten fand im Schnitt ein Nutzer den Weg zurück zur Website. Heute ist dieser Kontrakt gebrochen: KI-Crawler generieren Tausende oder Millionen von Zugriffen, während kaum Traffic durch Links oder Erwähnungen zurückkommt.

„Anthropics ClaudeBot zeigte im Juni 2025 das mit Abstand höchste Crawl‑zu‑Referral‑Verhältnis – etwa 70.900 Crawls pro einem Referral, weit mehr als jeder andere KI‑Crawler.“ (Cloudflare (Juli 2025))

robots.txt war so grundlegend für das Funktionieren des Internets, dass man ihr 2022 mit RFC 9309 endlich formell Anerkennung zollte. Doch selbst dieser späte Ritterschlag konnte ihr Schicksal nicht aufhalten.

Chronik eines schleichenden Endes

Weiterlesen nach der Anzeige

Die ersten Anzeichen des Wandels zeigten sich 2017, als das Internet Archive ankündigte, robots.txt bei der Archivierung historischer Inhalte nicht länger zu berücksichtigen. Am 17. April 2017 erklärte Mark Graham (Direktor der Wayback Machine), dass robots.txt-Dateien – insbesondere solche, die für Suchmaschinen gedacht sind – nicht immer mit den Archivierungszielen übereinstimmen. Das Internet Archive verfolge das Ziel, möglichst vollständige Schnappschüsse des Webs zu bewahren, einschließlich doppelter oder großer Inhalte.

„Over time we have observed that the robots.txt files that are geared toward search engine crawlers do not necessarily serve our archival purposes.“ (Mark Graham)

Doch das war nur ein Vorgeschmack auf die fortschreitende, systematische Ausschöpfung, die jetzt folgen sollte. Mit dem Aufkommen der künstlichen Intelligenz verwandelte sich das Internet von einem kollaborativen Raum in eine Extraktionszone.

Doch statt des erhofften kollaborativen Miteinanders folgte systematische Ausbeutung. KI-Konzerne errichteten neue digitale Barrieren: Cloudflares Default-Blocking, Paywalls für API-Zugang und exklusive Lizenzdeals mit ausgewählten Publishern. Content-Ersteller sahen sich einer industriellen Extraktionsmaschine gegenüber, die ihre Arbeit ohne Gegenleistung verwertete. Das Internet, einst als offenes Netz für alle konzipiert, verwandelte sich in eine zentralisierte Datenmine für Tech-Giganten.

OpenAI führte den Angriff mit seinem GPTBot, ChatGPT-User und OAI-SearchBot an – eine Dreifaltigkeit der Verletzung, die robots.txt hilflos zusehen ließ, wie ihre Direktiven geflissentlich ignoriert wurden. Das Unternehmen behauptete öffentlich Compliance, während Cloudflare im Juni 2025 ein vernichtendes Crawl-to-Referral-Verhältnis von 1.700:1 dokumentierte – industrielle Extraktion ohne nennenswerte Gegenleistung.

Anthropic fügte dem Leiden weitere Qualen hinzu. ClaudeBot, anthropic-ai und Claude-Web hämmerten auf Server ein, wobei iFixit eine Million Besuche in 24 Stunden und Freelancer.com fast vier Millionen in vier Stunden erlebte. Mit einem Crawl-to-Referral-Verhältnis von 73.000:1 überschritt Anthropic alle Grenzen des Anstands — es war, als würde man einem Nachbarn die Haustürschlüssel anvertrauen, damit er die Blumen gießt – nur um festzustellen, dass er den gesamten Hausrat abtransportiert hat.

Perplexity AI gehörte zu den aggressivsten Akteuren: Es nutzte verdeckte (undisclosed) IP-Adressen und Drittdienste, um Crawling-Aktivitäten zu verschleiern. Als CEO Aravind Srinivas öffentlich erklärte, robots.txt sei kein rechtliches Framework, war das ein offener Affront gegen das jahrzehntealte fragile Protokoll.

Eine Textdatei im Schatten des letzten Gefechts

In ihren letzten Monaten kämpfte robots.txt verzweifelt um die Relevanz vergangener Zeiten. Website-Betreiber entwickelten immer raffiniertere Unterstützungssysteme: Crawler-Fingerprinting mit TLS-Analyse (Transport Layer Security), Honeypot-Fallen und Verhaltensanalyse. Doch es war, als versuchte man, eine akute Blutvergiftung mit fiebersenkenden Mitteln zu behandeln – technisch durchdacht, aber dem Ausmaß der Bedrohung nicht gewachsen.

Das European Data Protection Board versuchte mit der Opinion 28/2024 dem Protokoll rechtliche Verbindlichkeit zu geben, während Italiens Datenschutzbehörde Garante OpenAI mit einer Strafe von 15 Millionen Euro belegte. Doch es waren verzweifelte Wiederbelebungsversuche eines längst kollabierten Systems – der freiwillige Respekt war nicht mehr zu retten.

Alternative Protokolle – ai.txt, TDM ReP, „No-AI-Training“ HTTP-Header – wurden als potenzielle Nachfolger diskutiert. Aber sie alle trugen den Makel ihrer Geburt: Sie entstanden nicht aus Kooperation, sondern aus Konfrontation.

Der Call for Proposals für die enterJS 2026 am 16. und 17. Juni in Mannheim ist gestartet. Bis zum 12. November suchen die Veranstalter nach Vorträgen und Workshops rund um JavaScript und TypeScript, Frameworks, Tools und Bibliotheken, Security, UX und mehr.

Source link

Verwandte Themen:Abschied IT Nachruf robots.txt Suchmaschine Von Web-Crawler Webentwicklung

Up Next

JetBrains macht ReSharper via Open VSX Registry zugänglich

Nicht verpassen

PHP-Community feiert 20 Jahre Symfony

Entwicklung & Code

Nach Großangriff: Paketmanager NPM schneidet alte Sicherheits-Zöpfe ab

Nach mehreren großangelegten Angriffswellen auf das NPM-Ökosystem ergreifen dessen Betreiber nun Maßnahmen, um eine Wiederholung zu verhindern. Im August und September hatten Unbekannte nicht nur mehrere Entwicklerkonten übernommen, sondern auch einen Wurm eingeschleust, der selbstständig weitere Node-Projekte infizierte. Um sich zu verbreiten, nutzte „Shai-Hulud“ Authentifizierungs-Token, denen es jetzt an den Kragen geht.

Weiterlesen nach der Anzeige

Die ersten Schritte ist NPM-Betreiber GitHub bereits gegangen – seit dem 13. Oktober sind granulare NPM-Zugriffstoken nicht mehr unbegrenzt lange, sondern nur noch maximal 90 Tage gültig, die Standardlaufzeit beträgt nun 7 statt 30 Tage. Eine Zwei-Faktor-Authentifizierung mittels TOTP (Time-based One-Time Password) kann für NPM-Paketverwalter nicht mehr neu eingerichtet werde. Wer TOTP bereits als zweiten Faktor zur Anmeldung nutzt, kann dabei vorerst bleiben, wird aber bald auf WebAuthn/Passkeys umstellen müssen.

Classic Tokens werden sehr bald beerdigt

Die sogenannten „Classic Tokens“ zur Authentifizierung (etwa in Automatisierungen oder CI/CD Pipelines) trägt GitHub bis Anfang November vollständig zu Grabe. Bestehende Token für NPM-Paketherausgeber zieht das Unternehmen ein und auf npmjs.com lassen sich künftig keine neuen mehr erstellen. Betroffene müssen sich umgehend um neue, granulare Token kümmern und ihre Automatisierungen aktualisieren, damit diese nach der Umstellung nicht vor die sprichwörtliche Wand laufen.

Mit diesen Schritten setzt GitHub eine Ankündigung aus Ende September teilweise in die Tat um – Entwickler und DevOps sind gefordert. Deren Verantwortung unterstreicht GitHub ausdrücklich: „Wir verstehen, dass diese Änderungen Aufwand von der Gemeinschaft verlangen. NPM abzusichern, ist eine geteilte Verantwortlichkeit.“ Die Änderungen verursachten vorübergehend Reibungen, seien aber notwendig, um künftigen Angriffen begegnen zu können.

Und gegenüber der September-Ankündigung tritt die zu Microsoft gehörende Entwicklerplattform sogar noch etwas mehr aufs Gaspedal: War dort noch von Mitte November als Löschzeitpunkt für „Classic Tokens“ die Rede, spricht GitHub in einer an Entwickler verschickten E-Mail von Anfang desselben Monats. Kurios: Obgleich erste Schritte bereits am Montag, dem 13. Oktober starteten, erhielten einige npm-Paketverantwortliche den Newsletter erst drei Tage später.

Ausblick: Trusted Publishing

Weiterlesen nach der Anzeige

Künftig sollen, so GitHubs Wunsch, Paketverwalter auf den Ansatz des „trusted publishing“ schwenken und auf langlebige Zugriffstoken ganz verzichten. Stattdessen sollen anlassbezogene Zugriffsrechte über den CI/CD-Anbieter, also etwa GitHub Actions oder GitLab CI/CD vergeben werden. Das verhindere, dass Token abhandenkommen und führe auch zu besserer Nachvollziehbarkeit, so das Unternehmen im Blog.

(cku)

Source link

Entwicklung & Code

software-architektur.tv: Wardley Maps mit Markus Harrer

Wardley Maps sind ein visuelles Werkzeug, das dabei unterstützen kann, Systeme im strategischen Zusammenhang zu betrachten und Entscheidungen bewusster zu treffen. In dieser Episode von Eberhard Wolffs Videcoast zeigt Markus Harrer, wie sich mit Wardley Mapping Abhängigkeiten in Softwaresystemen nachvollziehbarer darstellen lassen und wie es helfen kann, Architekturentscheidungen besser einzuordnen.

Weiterlesen nach der Anzeige

Darüber hinaus macht Markus Harrer anhand von Beispielen aus der Legacy-Modernisierung deutlich, wie diese Technik genutzt werden kann, um Diskussionen über den Umgang mit gewachsenen Systemen anzuregen und neue Blickwinkel darauf zu eröffnen. Teilnehmende erhalten Anregungen, wie Wardley Maps im Alltag eine strukturiertere und entspanntere Auseinandersetzung mit Softwaresystemen ermöglichen können.

Livestream am Freitag, 17. Oktober

Die Ausstrahlung findet am Freitag, 17. Oktober 2025, live von 13 bis 14 Uhr statt. Die Folge steht im Anschluss als Aufzeichnung bereit. Während des Livestreams können Interessierte Fragen via Twitch-Chat, YouTube-Chat, Bluesky, Mastodon, Slack-Workspace oder anonym über das Formular auf der Videocast-Seite einbringen.

software-architektur.tv ist ein Videocast von Eberhard Wolff, Blogger sowie Podcaster auf iX und bekannter Softwarearchitekt, der als Head of Architecture bei SWAGLab arbeitet. Seit Juni 2020 sind über 250 Folgen entstanden, die unterschiedliche Bereiche der Softwarearchitektur beleuchten – mal mit Gästen, mal Wolff solo. Seit mittlerweile mehr als zwei Jahren bindet iX (heise Developer) die über YouTube gestreamten Episoden im Online-Channel ein, sodass Zuschauer dem Videocast aus den Heise Medien heraus folgen können.

Weitere Informationen zur Folge finden sich auf der Videocast-Seite.

(mdo)

Source link

Entwicklung & Code

Webentwicklung: Vite+ als einheitliche JavaScript-Toolchain geplant

Im Rahmen der ViteConf hat das Entwicklungsteam von Vite das neue Projekt Vite+ angekündigt – ein Kommandozeilen-Entwicklertool als Drop-in-Upgrade für Vite mit zusätzlichen Features. Evan You, Entwickler des JavaScript-Frameworks Vue.js und des Frontend-Build-Tools Vite.js, teilt weitere Informationen dazu in einem Blogeintrag.

Weiterlesen nach der Anzeige

Call for Proposals für die enterJS 2026 am 16. und 17. Juni in Mannheim: Die Veranstalter suchen nach Vorträgen und Workshops rund um JavaScript und TypeScript, Frameworks, Tools und Bibliotheken, Security, UX und mehr. Vergünstigte Blind-Bird-Tickets sind bis zum Programmstart erhältlich.

Einheitliche JavaScript-Toolchain als Ziel

Wie Evan You ausführt, haben sich im JavaScript-Umfeld die Tooling-Komplexität und die Performance für Unternehmen als Flaschenhälse herausgestellt, da sie angesichts immer größerer Webanwendungen mit limitierten internen Tooling-Ressourcen umgehen müssen.

Insbesondere in Unternehmen mit mehreren Teams, die ihre jeweils eigene Toolauswahl treffen, seien diese Flaschenhälse gravierender. Beispielsweise müssten Dependency-Management und Security-Review in jedem Team einzeln gehandhabt werden, und sollten Teams oder Projekte einmal zusammengeführt werden, könne das in einem „Frankensteined Tool Stack“ enden. Hier setzt Vite+ an, um ein einheitliches JavaScript-Tooling bereitzustellen.

Die Features: Unit Tests, Linting, Bundling und mehr

Vite+ wird sich ebenso wie Vite via npm beziehen lassen. Neben vite dev und vite build bietet es zusätzliche Möglichkeiten:

Weiterlesen nach der Anzeige

vite new für das Scaffolding neuer Projekte mit einer für Vite+ empfohlenen Struktur
vite test für Vitest-basierte Unit Tests und mit Jest-kompatibler API
vite lint für das Code-Linting mittels Oxlint
vite fmt zur Code-Formatierung mit dem noch nicht veröffentlichten Oxfmt
vite lib für das tsdown- und Rolldown-basierte Bundling von Libraries
vite run als integrierter Monorepo-Task-Runner mit intelligentem Caching
vite ui als GUI-Devtools für Einblicke in Modul-Resolve/-Transform-Verhalten, Bundle-Größen-/Tree-Shaking-Analyse und mehr

Dabei ist Vite+ dank dem Vite-Ökosystem mit React, Vue, TanStack Start, SvelteKit und weiteren Frameworks kompatibel. Die komplette Compiler-Toolchain von Vite+ hat das Vite-Team in Rust implementiert und auf jedem Level – von Parser über Resolver und Transformer bis hin zu Minifier und Bundler – an der Performance gefeilt.

Kostenfrei für Open-Source-Projekte – aber nicht im Enterprise-Umfeld

Für individuelle Entwicklerinnen und Entwickler, Open-Source-Projekte und kleine Unternehmen soll Vite+ kostenfrei sein. Start-ups und größere Unternehmen werden dagegen zur Kasse gebeten. Weitere Details hierzu sollen folgen, wenn der Veröffentlichungstermin näher rückt. Eine öffentliche Preview ist für Anfang 2026 in Planung. Interessierte können sich bereits via Vite+-Website anmelden, um das Vite-Superset in einem Early-Access-Programm zu testen.

Weitere Informationen lassen sich der Ankündigung auf dem VoidZero-Blog entnehmen.

(mai)

Source link

Der ultimative Guide für eine unvergessliche Customer Experience

UX/UI & Webdesignvor 2 Monaten

Der ultimative Guide für eine unvergessliche Customer Experience

UX/UI & Webdesignvor 2 Monaten

Adobe Firefly Boards › PAGE online

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Social Mediavor 2 Monaten

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Posit stellt Positron vor: Neue IDE für Data Science mit Python und R

Entwicklung & Codevor 2 Monaten

Posit stellt Positron vor: Neue IDE für Data Science mit Python und R

EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events

Entwicklung & Codevor 1 Monat

EventSourcingDB 1.1 bietet flexiblere Konsistenzsteuerung und signierte Events

Fake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online

UX/UI & Webdesignvor 1 Monat

Fake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online

Firefox-Update 141.0: KI-gestützte Tab‑Gruppen und Einheitenumrechner kommen

Apps & Mobile Entwicklungvor 3 Monaten

Firefox-Update 141.0: KI-gestützte Tab‑Gruppen und Einheitenumrechner kommen

So baut Googles NotebookLM aus deinen Notizen KI‑Diashows

Online Marketing & SEOvor 3 Monaten

So baut Googles NotebookLM aus deinen Notizen KI‑Diashows

Inspohub

Nachruf: Abschied von robots.txt (1994-2025)

Entwicklung & Code

Nachruf: Abschied von robots.txt (1994-2025)

Ein Leben der stillen Dienste

Chronik eines schleichenden Endes

Eine Textdatei im Schatten des letzten Gefechts

Entwicklung & Code

Nach Großangriff: Paketmanager NPM schneidet alte Sicherheits-Zöpfe ab

Classic Tokens werden sehr bald beerdigt

Ausblick: Trusted Publishing

Entwicklung & Code

software-architektur.tv: Wardley Maps mit Markus Harrer

Livestream am Freitag, 17. Oktober

Entwicklung & Code

Webentwicklung: Vite+ als einheitliche JavaScript-Toolchain geplant

Einheitliche JavaScript-Toolchain als Ziel

Die Features: Unit Tests, Linting, Bundling und mehr

Kostenfrei für Open-Source-Projekte – aber nicht im Enterprise-Umfeld

Einkaufen in der AR-Brille: Snap zeigt neue Bezahlmöglichkeiten und KI-Tools

EU-Veggie-Verbot: Warum Rügenwalder jetzt mit „Schnötzel“ und „Bratdings“ droht

CB-Funk-Podcast #140: Hallo FSR 4 mit INT8, M5 und BF6, Tschüss Xbox und Win 10

Der ultimative Guide für eine unvergessliche Customer Experience

Adobe Firefly Boards › PAGE online

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Beliebt

Inspohub

Nachruf: Abschied von robots.txt (1994-2025)

Ein Leben der stillen Dienste

Chronik eines schleichenden Endes

Eine Textdatei im Schatten des letzten Gefechts

Das könnte Ihnen gefallen

Entwicklung & Code

Nach Großangriff: Paketmanager NPM schneidet alte Sicherheits-Zöpfe ab

Classic Tokens werden sehr bald beerdigt

Ausblick: Trusted Publishing

Entwicklung & Code

software-architektur.tv: Wardley Maps mit Markus Harrer

Livestream am Freitag, 17. Oktober

Entwicklung & Code

Webentwicklung: Vite+ als einheitliche JavaScript-Toolchain geplant

Einheitliche JavaScript-Toolchain als Ziel

Die Features: Unit Tests, Linting, Bundling und mehr

Kostenfrei für Open-Source-Projekte – aber nicht im Enterprise-Umfeld

Einkaufen in der AR-Brille: Snap zeigt neue Bezahlmöglichkeiten und KI-Tools

EU-Veggie-Verbot: Warum Rügenwalder jetzt mit „Schnötzel“ und „Bratdings“ droht

CB-Funk-Podcast #140: Hallo FSR 4 mit INT8, M5 und BF6, Tschüss Xbox und Win 10

Der ultimative Guide für eine unvergessliche Customer Experience

Adobe Firefly Boards › PAGE online

Relatable, relevant, viral? Wer heute auf Social Media zum Vorbild wird – und warum das für Marken (k)eine gute Nachricht ist

Beliebt