Connect with us

Entwicklung & Code

RSL 1.0 statt robots.txt: Neuer Standard für Internet-Inhalte


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Really Simple Licensing 1.0 – der Name soll Programm sein. Mit RSL 1.0 soll geregelt werden, wie KI-Unternehmen Inhalte von Verlagen und anderen Inhalteerstellern nutzen dürfen. Dazu gehören auch Lizenzvereinbarungen. Es handelt sich um einen offenen Web-Standard, der zusätzlich von Organisationen wie Cloudflare, Akamai, Creative Commons und der IAB, also dem Verband der Online-Werbebranche, unterstützt wird.

Weiterlesen nach der Anzeige

Mehr als 1500 Medienunternehmen sollen den Standard bereits befürworten. Auf der eigens eingerichteten Webseite heißt es, RSL werde von Milliarden Webseiten genutzt. Das entspräche den meisten hochwertigen Inhalten des Internets, die für das KI-Training der großen Anbieter relevant sind. Es ist „der erste Lizenz-Standard, der Inhalte im KI-Zeitalter schützt“, heißt es.

Der Standard soll maschinenlesbar und transparent Lizenzvorgaben bereithalten, er basiert auf dem bekannten RSS-Standard (Really Simple Syndication). Die bisher genutzte robots.txt-Datei ermöglicht den Webseitenbetreibern nur einfache Ja/Nein-Regeln. RSL soll das um eine „universelle Sprache für Inhaltsrechte und Lizenzbedingungen“ erweitern. Webseitenbetreiber können so festlegen und kommunizieren, dass etwa Suchmaschinen Inhalte nutzen dürfen, KI-Suchanwendungen aber ausgeschlossen sind. Zudem ist auch die Möglichkeit gegeben, Geld- oder Sachleistungen zu verlangen, wenn Inhalte genutzt werden – etwa für das Training von KI-Modellen.

RSL selbst kann Crawler technisch nicht ausschließen. Unterstützer des Standards wie Cloudflare und Akamai können das jedoch.

Derzeit ist es so, dass beispielsweise Google keine Unterscheidung seiner Crawler anbietet. Wer in der Suche auftauchen möchte, muss auch jene Crawler zulassen, die Inhalte etwa für KI-Produkte und das Training abgreifen. Die EU-Kommission hat erst diese Woche ein Verfahren eingeleitet, um genau dieses Verhalten zu untersuchen. Im Raum steht, ob Google wettbewerbswidrig handelt und sowohl Inhalteersteller als auch andere KI-Unternehmen benachteiligt.

Auch einzelne Lizenzvereinbarungen, die Google, OpenAI und Perplexity mit ausgewählten Verlagen aushandeln, sind keine flächendeckende Option, um faire Bedingungen zu schaffen. Sie betreffen immer nur wenige Inhalteersteller.

Weiterlesen nach der Anzeige

Zudem ist die robots.txt-Datei von einigen Crawlern ignoriert worden. Auch mit ihr lässt sich keine technische Blockade einrichten, es ist die maschinenlesbare Form einer Aufforderung, ein Standard, an den sich lange alle hielten. Umso wichtiger, dass nun auch CDN-Anbieter wie Cloudflare dabei sind.

Die IAB dürfte ebenfalls wegen des sich verändernden Werbemarktes an einer Lösung interessiert sein. Das bekannte Problem der wegfallenden Klicks und damit fehlender Anzeigenplätze auf Webseiten, wenn Menschen nur noch KI-Zusammenfassungen und KI-Antworten lesen, betrifft auch sie. Selbst wenn Google, OpenAI und Co Werbung in ihre KI-Produkte integrieren, obliegt ihnen dann auch das dazugehörige Geschäft samt allen Bedingungen.


(emw)



Source link

Entwicklung & Code

pandas 3.0 bringt einheitlichen String-Typ und Performance-Optimierung


Fast drei Jahre nach der letzten Hauptversion steht jetzt Version 3.0 von pandas, der Bibliothek zur Datenanalyse mit Python, am Start. Zu den wichtigsten Änderungen gehören der dedizierte String-Data-Typ str, eine verbesserte Copy-on-Write-Methode sowie eine neue Standardauflösung für datums- und zeitähnliche Daten. Letztere verwendet standardmäßig Mikrosekunden statt Nanosekunden, um Grenzwertfehler für Datumsangaben mit einem Jahr vor 1678 oder nach 2262 zu vermeiden.

Weiterlesen nach der Anzeige

Bei installierter PyArrow-Bibliothek interpretiert pandas 3.0 String-Spalten automatisch als Datentyp str statt als NumPy-object. Das soll für Leistungssteigerung und effizientere Zuweisung von Python-Objekten sorgen. Wie der neue Code aussehen kann, zeigt folgendes Beispiel:


# Old behavior (pandas < 3.0)
>>> ser = pd.Series(["a", "b"])
>>> ser
0 a
1 b
dtype: object # <-- numpy object dtype

# New behavior (pandas 3.0)
>>> ser = pd.Series(["a", "b"])
>>> ser.dtype
>>> ser
0 a
1 b
dtype: str # <-- new string dtype


Mit pandas 3.0 ist Copy-on-Write (CoW) nun die Standard-Speicherverwaltungstechnik. Damit verhält sich jedes Index-Ergebnis wie eine Kopie, sodass Änderungen am Ergebnis den ursprünglichen DataFrame nicht beeinflussen.

Da verkettete Zuweisungen nicht mehr funktionieren, entfällt SettingWithCopyWarning. Damit können die copy()-Aufrufe zum Unterdrücken dieser Warnung entfallen, was ebenfalls eine Verbesserung der Performance bedeutet.


# Old behavior (pandas < 3.0) - chained assignment
df["foo"][df["bar"] > 5] = # This might modify df (unpredictable)

# New behavior (pandas 3.0) - must do the modification in one step (e.g. with .loc)
df.loc[df["bar"] > 5, "foo"] = 100


Weiterlesen nach der Anzeige

Mit dem neuen Release hat das Pandas-Team einige veraltete Funktionen entfernt. Deshalb empfiehlt es, zunächst ein Upgrade auf pandas 2.3 durchzuführen, um sicherzustellen, dass der Code ohne Fehlermeldungen läuft. Erst anschließend sollte man den Wechsel auf Version 3.0 angehen.

Installieren lässt sich pandas 3.0 über PyPI mit python -m pip install --upgrade pandas==3.0.* oder über conda-forge mit conda install -c conda-forge pandas=3.0.

In den Release Notes von pandas 3.0.0 lassen sich sämtliche Änderungen im Detail nachlesen. Weil sie ein Code-Update erforderlich machen können, stellen die Entwicklerinnen und Entwickler Migrationsanleitungen zur Verfügung, unter anderem für den neuen String-Data-Typ und die Copy-on-Write-Methode.

Lesen Sie auch


(who)



Source link

Weiterlesen

Entwicklung & Code

Die Produktwerker: Vibe Coding verändert die Produktentwicklung


Immer mehr Produktmenschen bauen selbst Software, statt ausschließlich Konzepte, Anforderungen oder Prototypen zu liefern. Entscheidungen werden direkt im Code sichtbar, Feedbackschleifen verkürzen sich, die Entwicklung gewinnt deutlich an Geschwindigkeit.

Weiterlesen nach der Anzeige

In dieser Podcastfolge diskutieren Oliver Winter und Tim Klein, welche Chancen und Risiken diese Entwicklung für Product Owner, Developer und Produktteams mit sich bringt. Sie beleuchten, warum Vibe Coding schnelles Lernen ermöglicht, gleichzeitig aber die Gefahr besteht, dass Product Discovery, Nutzerfeedback und Validierung in den Hintergrund geraten.

Ein weiterer Fokus liegt auf der veränderten Verantwortung. Wenn Produktentscheidung und Umsetzung zusammenfallen, verschwimmen klassische Rollenbilder. Das kann effizient sein, erfordert jedoch bewusste Auseinandersetzung mit Qualität, Wartbarkeit und langfristigen Auswirkungen.

Die Folge ordnet Vibe Coding als Werkzeug ein, das die Zusammenarbeit stärken kann – vorausgesetzt, Produktdenken, Nutzerorientierung und wirtschaftliche Verantwortung bleiben zentrale Leitplanken.


Product Owner Days 2026

Product Owner Days 2026

(Bild: deagreez/123rf.com)

Fachvorträge und Networking-Möglichkeiten: Die Product Owner Days am 5. und 6. Mai 2026 in Köln befassen sich in über 20 Vorträgen mit aktuellen Themen rund um Product Ownership, KI im Produktmanagement, User Research, Product Discovery und Product Economics.

Die aktuelle Ausgabe des Podcasts steht auch im Blog der Produktwerker bereit: „Lässt Vibe Coding Product-Owner- und Developer-Rollen verschmelzen?“.

Weiterlesen nach der Anzeige


(mai)



Source link

Weiterlesen

Entwicklung & Code

Linux-Kernel: Ein „Konklave“ entscheidet im Zweifel über die neue Leitung


Bei Bedarf entscheiden zentrale Programmierer von Linux zukünftig bei einem „Konklave“, wer die Entwicklung des Kernels fortan leitet. Zu so einer Versammlung soll es allerdings nur kommen, falls designierte Nachfolger den Posten nicht übernehmen können oder wollen.

Weiterlesen nach der Anzeige

Dieser bislang ungeklärte Fall ist ab jetzt über einen Text in einer Datei namens „conclave“ geregelt, den Linus Torvalds Samstagnacht in die Dokumentation seines Linux genannten Kernels eingepflegt hat. Der Text betont, dass die Entwicklung zwar einerseits verteilt erfolgt, schlussendlich aber durch ein einzelnes Paar Hände geht. Das sind seit Anbeginn die von Linus Torvalds, wenn man von einer Schaffenspause bei Linux 4.19 absieht.

Diese hat auch gezeigt, dass andere Entwickler Zugriff auf den Hauptentwicklungszweig des Kernels haben und die Entwicklungsleitung im Fall der Fälle schnell übernehmen können. Sollten diese Personen das aber nicht können oder wollen, obliegt es fortan dem Organisator des letzten Kernel Maintainer Summit, ein Meeting einzuberufen, um über das weitere Vorgehen zu entscheiden. Dazu lädt er mindestens die Teilnehmer des letzten Summits und die Mitglieder des Technical Advisory Board (TAB) der Linux Foundation ein; alle von ihnen können aber weitere ins Boot holen.

Triebkraft hinter dem Text mit dem neuen Prozedere war Dan Williams, der seit Jahren zu den zentralen Linux-Entwicklern zählt und auch Mitglied des TAB ist. Er hatte die Nachfolgeregelung im Dezember beim letzten Maintainer Summit angesprochen und den Text zwischenzeitlich ausgearbeitet.

Den ratifizierte Torvalds keine 24 Stunden nach der Veröffentlichung, indem er ihn in die Quellen integrierte – womit er letztlich die sonst bei Kernel-Änderung übliche öffentliche Diskussionsphase nach kurzer Zeit abwürgte.

Weiterlesen nach der Anzeige

Letztlich bleibt aber ohnehin abzuwarten, ob oder wann dieses Prozedere je angewendet werden wird: Das Ganze greift schließlich nur, wenn keiner von denen mit den nötigen Zugriffsrechten den Job übernehmen kann oder will. Einer von ihnen ist Greg Kroah-Hartman, der Torvalds bei der Entwicklung von 4.19 vertreten hat. Er gilt gemeinhin auch als designierter Nachfolger, wie wir im Herbst bereits näher erläutert haben: Missing Link: Wie es bei Linux ohne Linus Torvalds weiterginge


(dmk)



Source link

Weiterlesen

Beliebt