Connect with us

Künstliche Intelligenz

Medizinregistergesetz: Viele offene Fragen bei Forschungskennziffer und Co.


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Mehrere Gesetzgebungsvorhaben sollen die Art und Weise, wie medizinische Daten gesammelt, genutzt und verknüpft werden, grundlegend verändern: unter anderem das Forschungsdatengesetz aus dem Bundesforschungsministerium sowie das Gesetz für Daten und Digitale Innovation im Gesundheitswesen (GeDIG) und das Medizinregistergesetz (MRG) aus dem Bundesgesundheitsministerium (BMG). Ziel ist eine bessere Nutzung von Gesundheitsdaten für die Forschung, die Versorgung und die Politik. Eine Forschungskennziffer soll dafür sorgen, dass Daten aus verschiedenen Quellen verknüpfbar gemacht werden. Kürzlich gab es dazu auch eine Anhörung im Gesundheitsausschuss.

Weiterlesen nach der Anzeige

„In Deutschland haben wir mehr als in anderen Ländern verteilte Datenbestände. Nicht nur aus Krankenhäusern und Praxen, sondern auch Daten aus Rehakliniken bei den Rentenversicherungsträgern oder von der Unfallversicherung. Mangels durchgängiger standardisierter medizinischer Dokumentation, gerade im ambulanten Bereich, erhalten wir bestimmte Informationen eben zum Beispiel nur aus den Daten der Krankenkassen. Wer forschen will, kämpft gegen eine strukturelle Zersplitterung, die historisch gewachsen und politisch kaum aufzubrechen ist“, so Sebastian C. Semler, Arzt und seit 2004 Geschäftsführer der Technologie- und Methodenplattform für die vernetzte medizinische Forschung e. V. (TMF).

Daher ist eine seit Jahren diskutierte Lösung eine eindeutige Kennziffer, die Datensätze verschiedener Herkunft einem gemeinsamen Fall zuordnet. Nicht um den Menschen dahinter zu identifizieren, sondern um zu wissen, dass dieser Datensatz aus dem Krankenhaus und jener aus der Rehaklinik zur selben Person gehören, betont Semler: „Es ist gar nicht wichtig, dass ich den Bürger dahinter erkenne. Es ist wichtig, dass ich weiß: Der Datensatz von Bürger X beim Niedergelassenen gehört zum gleichen Bürger wie der entsprechende Datensatz im Krankenhaus oder eben in der Rehaklinik. Dabei ist im Kern völlig unerheblich, ob das jetzt der Bürger Müller, Meier oder Schulze ist – es ist dabei entscheidend, dass ich die richtigen Daten zusammenführe.“

Mittels Record-Linkage werden Datensätze über Kombinationen von Wohnort, Alter, Geschlecht und ähnlichen Merkmalen verknüpft, was bis zu einem gewissen Grad gut funktioniert. Auf Basis anonymisierter Daten lassen sich durchaus Daten zusammenführen. Laut Semler sei Record-Linkage mit manuellen Prüfungen sehr aufwendig und skaliere nicht. Massendaten ließen sich in dieser Form nicht analysieren. Mit 30 Patienten ginge das noch, aber bei 300.000 Datensätzen nicht.

Nur relativ wenige Identifikatoren sind Semler zufolge in der Fläche verfügbar und geeignet. Dazu gehören die Krankenversichertennummer (KVNR), die Steuer-ID und die Sozialversicherungsnummer. Zwar sei die KVNR in vielen Bereichen des Gesundheitswesens geeignet, aber nicht überall. Die Kassenärztliche Bundesvereinigung begrüßt in ihrer Stellungnahme den Einsatz der KVNR. Anders sieht es jedoch der IT-Sicherheitsrechtler Prof. Dennis-Kenji Kipker, der die Einführung einer Forschungskennziffer grundsätzlich begrüßenswert findet: Das greife aus seiner Sicht allerdings zu kurz, „solange sie nicht wirklich sektorübergreifend angelegt ist und Datenverknüpfungen etwa für Präventions- oder Pandemieforschung ermöglicht“. Zukünftig wird es immer relevanter, wie sich die Arbeitsfähigkeit der Bevölkerung entwickelt, ob Reha-Maßnahmen und Präventionsmaßnahmen wirken. „Dann sind Sie ganz schnell bei Datenbeständen, die Sie dringend brauchen, die aber keine KVNR halten“, so Semler.

Weiterlesen nach der Anzeige

Wie eine Forschungskennziffer technisch umgesetzt werden könnte, ist nicht trivial zu beantworten. Im Medizinregistergesetz (§ 20 Abs. 1 MRG) dürfen qualifizierte Register „den unveränderbaren Teil der Krankenversicherungsnummer nach § 290 Absatz 1 Satz 2 des Fünften Buches Sozialgesetzbuch zur Erzeugung eines Pseudonyms für die Verknüpfung mit anderen Datenquellen verarbeiten“. Das GeDIG regelt in § 3 GDNG die Forschungskennziffer ebenfalls auf Basis der KVNR. Das Forschungsdatengesetz des BMFTR hingegen setzt auf die Steuer-ID.

Alle datenführenden Stellen erhalten einen Algorithmus, der aus einem vorhandenen „Primäridentifikator“, etwa der KV-Nummer, ein Pseudonym generiert. Semler beschreibt das Modell als technisch grundsätzlich gangbar – mit Schwächen vor allem bei Skalierbarkeit und Updatefähigkeit. „Es ist durchaus denkbar, das so zu machen, wie es im GeDIG steht: Dass ich einen Identifikator habe, aus dem heraus ich eine solche ID generiere.“ Dann werde die ID an alle datenhaltenden Stellen verteilt. Dabei sei jedoch problematisch, dass das Verfahren überholt werden könne und dann nicht mehr sicher sei und dann in Abstimmung aller datenhaltenden Stellen ein neues Verfahren eingeführt werden müsse.

Bei einer weiteren Möglichkeit empfange eine Einrichtung auf Anfrage verschiedene Identifikatoren, generiere daraus ein anlassbezogenes Pseudonym und gebe dieses an den Forscher heraus, ohne dauerhaft personenbezogene Daten zu speichern: „Vielleicht muss ich gar nicht alle IDs irgendwo einführen“, erklärt Semler, „sondern ich schaffe eine Zentralstelle, die zum Bürger gehörige Identifikatoren zusammenführen kann, selbst auf Anfrage ein Pseudonym generiert und herausgibt, und die vor jeder Datenanfrage eine solche ID an den Forscher herausgibt, mit der er eben unterschiedliche Datenbestände abfragen kann. Wie auch immer man es macht: wichtig ist, einmal ein durchgängiges Fachkonzept zu entwickeln – gemeinsam mit Datennutzenden, die Daten zu Auswertungszwecken verknüpfen wollen, und mit Datenhaltenden, die die entsprechenden IDs in ihren Datenbeständen einführen müssen.“

Die Koordinierungsgruppe Gesundheitsforschungsdateninfrastrukturen (GFDI), ein breites Bündnis wissenschaftlicher Organisationen unter Koordination von TMF, Medizininformatik-Initiative, dem Netzwerk Universitätsmedizin und weiteren, hat dazu in einer gemeinsamen Stellungnahme zum GeDIG unmissverständlich Stellung bezogen: „Zu vermeiden wäre ein Zustand, in dem unterschiedliche Gesetze die Einführung unterschiedlicher Unique Identifier (hier KVNR, dort Steuer-ID, sowie digitale Identität der gematik und EU-ID für die Versorgung) und mehrere Pseudonymisierungsverfahren erfordern, was allen Akteuren unnötige Doppelaufwände abverlangen würde.“ Erfahrungen aus der Verwaltungsdigitalisierung würden bereits zeigen, dass „die Einführung einer Forschungskennziffer in Datenbestände für die datenhaltenden Stellen ohnehin mit einem erheblichen Aufwand verbunden […]“. Dieser müsse in „Zeit- und Ressourcenplänen der Umsetzung berücksichtigt werden“.

Die GFDI benennt weitere konkrete Grenzen der KVNR: So sei die Verpflichtung, die KVNR aufzunehmen, für manche Register schlicht nicht sinnvoll. Ein Obduktionsregister etwa hat keinen Bezug zu lebenden Versicherten. Ein Lebendspenderegister hält die KVNR des Empfängers, nicht des Spenders. Und schließlich widerspreche sich die Pflicht zur KVNR-Aufnahme mit der im Gesetz vorgesehenen Widerspruchsmöglichkeit gegen eben diese Verarbeitung. Außerdem fehle der Bezug zu einem Unique Identifier, der nach der KVNR kommt – also eine langfristig tragfähige Lösung, die auch über den GKV-Bereich hinaus funktioniert.

Ebenso kritisiert die GFDI, dass die bisherigen Regelungen zur Datenverknüpfung – basierend auf der KVNR und dem staatlichen Pseudonymisierungs- und Vertrauensstellenverfahren beim RKI – „für die Bedarfe der medizinischen Forschung in toto […] viel zu kurz“ greifen. Was es stattdessen brauche, sei ein einheitlicher Identifikator, „der es möglich macht, Datenverknüpfungen über unterschiedliche Datenbestände und über unterschiedliche Geltungsbereiche gesetzlicher Grundlagen (FDG, GDNG, SGB) und deren staatlich-behördlicher Instanzen (FDZ, RKI, DZM etc.) und Verfahren hinweg für die medizinische Forschung datenschutzkonform herbeizuführen.

Thilo Weichert, ehemaliger Landesdatenschutzbeauftragter Schleswig-Holsteins und heute Co-Vorsitzender von Digitalcourage, stellt in seiner Stellungnahme fest, dass das MRG nicht mit dem Forschungsdatengesetz des BMFTR abgestimmt sei, das ebenfalls die Nutzung von Medizinregistern regeln solle. „Diese Diskrepanz führt zwangsläufig zu Rechtsunsicherheit“, schreibt er. Ein weiterer Kritikpunkt ist, dass der Gesetzentwurf Weichert zufolge vollständig ignoriere, dass es sich bei Medizinregistern weitgehend um Datenvermittlungsdienste im Sinne des europäischen Data Governance Acts (DGA) handele. Der DGA mache verbindliche Vorgaben zur Transparenz, Unabhängigkeit und zum Schutz der Betroffenen, die der Entwurf schlicht nicht berücksichtigt würden.

Kritikern zufolge ist die Forschungskennziffer zwar aus Forschungssicht notwendig, aber bei falscher Umsetzung hochproblematisch. Die Gesetzentwürfe sehen vor, dass Daten nicht mit Klarnamen, sondern pseudonymisiert zusammengeführt werden – auf Basis des unveränderlichen Teils der Krankenversicherungsnummer. „Pseudonymisierung bedeutet nicht Anonymisierung. Auch pseudonymisierte Gesundheitsdaten sind de facto personenbezogene Daten im Sinne der DSGVO, weil sie grundsätzlich wieder einer Person zugeordnet werden können – insbesondere wenn große Datensätze miteinander verknüpft werden,“ kritisiert Stella Merendino von den Linken.

„Das Gesundheitsministerium plant, das Gesundheitsdatennutzungsgesetz umfassend zu überarbeiten und dabei eine Forschungskennziffer einzuführen, mit der Gesundheitsdaten aus verschiedenen Datenquellen für Sekundärzwecke und damit auch für die wissenschaftliche medizinische Forschung zusammengeführt werden können“, sagt Weichert. Dabei werde, um möglichst viele Daten zu nutzen, „allen Gesundheitsdateninhabern erlaubt, die dort vorhandenen Patientendaten mit dieser Forschungskennziffer zu verbinden. Zweck der Kennziffer ist die Pseudonymisierung im Rahmen der Sekundärnutzung, also das Ersetzen der Klarnamen der Patienten durch diese Kennziffer“.

Merendino kritisiert: „Auch wenn Name und Adresse entfernt werden, können Daten über diese Nummer oder daraus erzeugte Kennzeichen langfristig immer wieder derselben Person zugeordnet werden – besonders bei raren Krankheitsbildern. Wenn aus dieser oder daraus abgeleiteten Identifikatoren stabile Forschungspseudonyme erzeugt werden, entsteht eben kein wirklich flüchtiger Datensatz, sondern eine dauerhaft verknüpfbare Datenbiografie.“

Das Zusammenführen der Daten werde so gelingen, so Weichert, „der Schutz der Daten aber nicht: Die Forschungskennziffer wird bei vielen Gesundheitseinrichtungen verfügbar sein. Alle diese Einrichtungen können so fremde über die Datenzusammenführung erlangte Daten den Betroffenen namentlich zuordnen. Bei der Ziffer handelt es sich um eine ‚nationale Kennziffer‘ gemäß Art. 87 DSGVO. Eine solche Ziffer ist nur zulässig, wenn sie ‚unter Wahrung geeigneter Rechte und Freiheiten der betroffenen Person‘ verwendet wird“, erklärt Weichert. Allerdings enthalte der Entwurf diese Garantien nicht.

Weichert benennt in seiner Stellungnahme zum MRG (PDF) das Re-Identifikationsrisiko explizit als „gewaltig“. Explizite Kritik äußert er auch an der vorgesehenen Speicherdauer von 100 Jahren, die mit Forschungsinteressen begründet werden: „Derartige Forschungsinteressen können aber nicht in Bezug auf sämtliche in Medizinregistern gespeicherten Daten für diese lange Zeit für angemessen angesehen werden. Angesichts der ungenügenden Schutzvorkehrungen hinsichtlich der zumeist mit Klarnamen arbeitenden Register wird mit der Speicherdauer ein lebenslanges unverhältnismäßiges Risiko für die Betroffenen begründet“.

„Damit entsteht faktisch die technische Grundlage für jahrzehntelang nachvollziehbare Gesundheitsdatenbiografien. Während weiter empfohlen wird, Daten möglichst nur begrenzt und zweckgebunden vorzuhalten, öffnet der Gesetzentwurf die Datenverarbeitung sehr breit auch für Training, Validierung und Testung von KI-Systemen“, gibt Merendino zu bedenken. „Geschichte und internationale Beispiele zeigen leider, dass einmal geschaffene Dateninfrastrukturen fast immer ausgeweitet werden,“ mahnt Merendino. Als konkretes Beispiel verweist sie auf Großbritannien. Dort erhielt Palantir 2023 den Zuschlag für die sogenannte „Federated Data Platform“ des NHS – ein riesiges Projekt zur Zusammenführung von Gesundheits- und Verwaltungsdaten. Es folgte massive Kritik, nachdem bekannt wurde, dass externe Vertragspartner teilweise Zugriff auf identifizierbare Patientendaten erhalten hatten. Laut Guardian prüft NHS England inzwischen, ob Ausstiegsmöglichkeiten aus dem 330-Millionen-Pfund-Vertrag genutzt werden können.

Merendino betont auf Anfrage ausdrücklich: Es geht ihr nicht darum, Forschung pauschal abzulehnen. Ihr Palantir-Vergleich beziehe sich „auf die grundsätzliche Infrastruktur-Logik großer verknüpfbarer Datenräume. Demokratische und datenschutzpolitische Fragen werden nicht beantwortet: Wer kontrolliert diese Systeme? Welche privaten Akteure erhalten künftig Zugriff? Wie wird verhindert, dass aus Forschungsinfrastrukturen später Steuerungs- oder Bewertungsinstrumente werden?“

Auch Weichert kritisiert in seiner Stellungnahme an den Bundestag, die erlaubten Zwecke gingen weit über Forschung hinaus und erstreckten sich, selbst mit identifizierenden Daten, auf operative Zwecke wie Qualitätssicherung, Unterstützung politischer Entscheidungsprozesse und Entwicklung von KI-Systemen. „Eine derartig weitgehende Verarbeitungsbefugnis ist unverhältnismäßig und daher verfassungswidrig“, schreibt er. Besonders problematisch: Der Einsatz von KI sei sogar bei identifizierenden Daten ausdrücklich erlaubt – ohne verpflichtende Pseudonymisierung.

Es fehle an der nötigen Transparenz für die Betroffenen. „Während jeder Forschende die Patientendaten für sein Projekt erhalten kann, wird den Betroffenen die Auskunft über ihre Daten verweigert; selbst ein Überblick, bei wem die Daten landen, wird ihnen vorenthalten“, kritisiert Weichert gegenüber heise online. Das Risiko für Datenmissbrauch sei hoch, weshalb eine „umfassende Kontrolle“ und „wirksam vollziehbarer Sanktionsregelungen“ notwendig seien. Doch werde die Datenschutzkontrolle nicht verbessert, „sondern nur konzentriert. Und jede Strafverfolgung wird von einem Strafantrag abhängig gemacht. Da Betroffene von sie betreffenden Datenmissbräuchen keine Kenntnis erlangen werden, können sie auch keinen Strafantrag stellen“.

„Weitere Vorkehrungen, wie sie der europäische Gesundheitsdatenraum vorsieht, fehlen. Der Entwurf muss umfassend nachgebessert werden. Anderenfalls sind Verstöße gegen das Grundrecht auf Datenschutz und das Patientengeheimnis vorprogrammiert“, schlussfolgert Weichert.

Auf Anfrage sagt das BMG, die Forschungskennziffer stelle „ein einheitliches Konzept für eine sektorspezifische Kennziffer im Gesundheitsbereich dar, deren Einführung im MRG vorbereitet und im GeDIG-E vollendet werden soll.“ Die KVNR biete sich an, weil sie bei Gesundheitsdateninhabern weit verbreitet sei. „Auch die Rentenversicherung und die Unfallversicherung verfügen bereits über KVNR,“ heißt es von einer BMG-Sprecherin. Die Konzeptionierung sei zudem gemeinsam mit Vertreterinnen und Vertretern der GFDI in einer Workshop-Reihe zur EHDS-Durchführung erfolgt, an der auch das BMFTR beteiligt gewesen sei. Zudem betont das BMG, die Forschungskennziffer sei für die Durchführung des EHDS „zwingend erforderlich“, da „nur so nachgehalten werden kann, wer bestimmten Datennutzungszwecken widersprochen hat.“

„Die technische Ausgestaltung der Forschungskennziffer obliegt dabei der koordinierenden Zugangsstelle für Gesundheitsdaten. Diese Aufgabe soll gemäß GeDIG-Entwurf von der Datenzugangs- und Koordinierungsstelle beim BfArM (dem Bundesinstitut für Arzneimittel und Medizinprodukte) übernommen werden“. Das technische Verfahren werde im Benehmen mit dem Bundesamt für Sicherheit in der Informationstechnik und dem Bundesdatenschutzbeauftragten festgelegt. „Damit ist eine spätere Anpassung des Algorithmus an den Stand der Technik möglich“, so das BMG auf Anfrage.

Uneinigkeit herrscht auch bei den Widerspruchsregelungen. Das GeDIG differenziert den Widerspruch nach Nutzungszwecken, beim Medizinregistergesetz ist etwa ein Widerspruch gegen die Datenerhebung und die Verarbeitung der KVNR möglich. Die GFDI empfiehlt in ihrer Stellungnahme zum GeDIG ausdrücklich, „zu prüfen, ob die gestufte Widerspruchsmöglichkeit wirklich erforderlich ist, zumal sie der EHDS nicht verbindlich vorsieht. Eine Widerspruchsmöglichkeit zu einzelnen Nutzungszwecken verkomplizieren das Widerspruchsverfahren für alle Beteiligten erheblich und werden einer notwendigen Automatisierung von Datennutzungsanfragen empfindlich im Wege stehen. Den Betroffenenrechten ist mit der Möglichkeit, grundsätzlich der Nutzung zu widersprechen, Genüge getan.“

Semler spricht sich für ein grundsätzliches Widerspruchsrecht aus. Wer nicht möchte, dass seine Daten für Forschung genutzt werden, soll das klar erklären können: „Wenn ich als Bürger grundsätzlich sagen kann, ich habe keine Lust, dass meine Daten für Forschung genutzt werden, dann ist meiner Autonomie als Bürger Genüge getan.“

Merendino zufolge müsse das Widerspruchsrecht nicht nur formal existieren, sondern technisch vollständig und maschinell umgesetzt werden. Ein erklärter Widerspruch muss zuverlässig umgesetzt werden, was aktuell nicht der Fall ist. Das Widerspruchsrecht ist in seiner jetzigen Form weder praktisch handhabbar noch datenschutzrechtlich belastbar. Aktuell gibt es immer mal wieder Schwierigkeiten bei der Umsetzung des Widerspruchsrechts.

Weichert kritisiert, dass Betroffene mangels individueller Information gar nicht in der Lage sind, informierte Widersprüche zu erklären. Wer nicht weiß, wer seine Daten wie nutzt, kann nicht sinnvoll widersprechen. Die Widerspruchsmöglichkeit ist beispielsweise gegen die Nutzung des unveränderbaren Teils der KVNR formal vorhanden, praktisch aber entwertet. Es fehle unter anderem eine individuelle Information über das Widerspruchsrecht, die „lediglich öffentlich und allgemein“ vorgesehen ist. Da sich die Widerspruchsmöglichkeit auf die Abwehr einer „eher abstrakten Gefahr eines Datenmissbrauchs in äußerst komplexen Verarbeitungszusammenhängen“ beziehe, sei es für Betroffene kaum möglich, insofern eine rationale Entscheidung zu treffen.

Was ebenfalls fehle, sei eine tragfähige Finanzierung. Der Gesetzentwurf schaffe erhebliche neue Anforderungen an Qualitätsentwicklung, Dokumentation, Interoperabilität und regulatorische Anpassung. Bei den Vorhaben mangelt es jedoch – wie so oft – an der Finanzierung, wie zahlreiche Verbände in ihren Stellungnahmen bemängeln. Dr. Anne Regierer, Sprecherin der TMF-Arbeitsgruppe Register, sagt dazu: „Nach heutigem Stand würde kaum ein Register eine Qualifizierung nach dem vorgesehenen Verfahren anstreben, weil der Aufwand hoch, der konkrete Nutzen gering und die Risiken schwer einzuschätzen sind.“

Das BMG sieht das anders: Das MRG schaffe „erhebliche Erleichterungen für die Betreiber qualifizierter Medizinregister“ – etwa durch erleichterte Datenverarbeitung per Opt-out und durch Kooperationsmöglichkeiten mit anderen Registern. „Schon jetzt finanzieren sich Medizinregister u.a. durch nutzungsabhängige Bereitstellung ihrer Daten. Inwieweit sich für Medizinregister darüber hinaus andere Finanzierungsmodelle anbieten, geht mit der Frage einher, in welcher Form und durch welche Akteure qualifizierte Medizinregister zukünftig genutzt werden,“ so eine Sprecherin. Weitere Finanzierungsmodelle seien eine nachgelagerte Frage: „Das Medizinregistergesetz geht mit seinen Lösungen also nur einen ersten Schritt, an den sich weitere Fragestellungen anschließen.“

Weicherts Minimalforderungen für einen solchen Rahmen sind klar, es braucht ausreichende Schutzvorkehrungen: Die Information der Betroffenen muss konkret im Einzelfall erfolgen, nicht nur allgemein. In seiner Stellungnahme an den Bundestag fordert er zahlreiche weitere Regelungen. Dazu zählen beispielsweise eine zweckgebundene differenzierte Speicherfrist, keine pauschalen Freigaben und ein Beschlagnahmeverbot. Zudem müsse das Zentrum für Medizinregister unabhängig genug sein, um tatsächliche Kontrollfunktionen wahrzunehmen.

Zwar begrüßt Weichert eine Ordnung der unübersichtlichen Registerlandschaft, jedoch verstoße der Entwurf „in vieler Hinsicht gegen die DSGVO sowie, grundsätzlicher, gegen das europarechtlich und verfassungsrechtlich garantierte Grundrecht auf Datenschutz“.

Auch Merendino geht es nicht darum, die Forschung pauschal abzulehnen. „Gute Forschung kann Versorgung verbessern. Aber je zentraler, dauerhafter und verknüpfbarer Gesundheitsdaten organisiert werden, desto höher müssen Datenschutz, demokratische Kontrolle und Transparenz sein.“ Nun ist es Aufgabe der Politik, sich um die Regelungen zum Datenschutz, Konzepte und die Finanzierung zu kümmern. „Das schönste Gesetz nutzt nichts, wenn es hinterher keine Anbindung findet,“ so Semler.


(mack)



Source link

Künstliche Intelligenz

Die Claude-Mythos-Lüge | c’t 3003


Dass Claude Fable beziehungsweise Mythos das teuerste KI-Modell ist – daran gibt es keinen Zweifel. Aber ist es auch das Beste? c’t 3003 hat’s getestet.

Weiterlesen nach der Anzeige

(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)

Guckt mal hier, jetzt hat Anthropic Mythos veröffentlicht. Ihr erinnert euch vielleicht, das KI-Modell, bei dem es vor zwei Monaten noch hieß, das Modell sei viel zu gefährlich, um es zu veröffentlichen, weil man damit angeblich in die meisten Software-Programme einbrechen kann. Also das Ding findet angeblich bislang unbekannte Sicherheitslücken. Und deshalb hat sich Anthropic einen Trick ausgedacht. Das, was sie veröffentlicht haben, also was ich hier in diesem Video getestet habe, nennen sie Fable. Das ist laut Anthropic aber Mythos. Aber halt Mythos, das sich weigert, Arbeit aus den Themenbereichen Cybersecurity, Biologie, Chemie und Wissensdestillation zu übernehmen. Fable kann aber auch noch andere tolle Sachen, zum Beispiel besser coden als Opus. Das kann ich schon mal spoilern. In diesem Video beantworten wir, ob Fable den Mythos-Hype rechtfertigen kann als unglaublich gefährliches, fähiges Modell, wie ihr da dran kommt, wie teuer das Ganze wird und ob das Modell endlich versteht, was auf meiner Kappe hier draufsteht. Bleibt dran.

Liebe Hackerinnen, liebe Internet-Surfer, herzlich willkommen hier bei….

Ja, Anthropic hat’s veröffentlicht. Mythos bzw. Fable. Mythos, übrigens griechisch „mythos“ für „sagenhafte Geschichte“, und Fable soll laut Anthropic die lateinische Variante davon sein. Streber-Keno sagt, dass das eigentlich „Fabula“ heißen müsste, aber okay, was weiß ich schon. Auf jeden Fall sagt Anthropic, dass Mythos und Fable wirklich erstmal grundsätzlich identisch sind. Das kann man auch daran sehen, dass Anthropic in seiner eigenen Benchmark-Tabelle Mythos und Fable in einer Spalte zusammenfasst. Der Unterschied ist, dass bei Fable eine Erkennung vorgeschaltet ist, die merkt, ob ein verbotenes Thema angeschnitten wird. Das läuft mit Constitutional Classifiers. Wenn ihr das genauer wissen wollt, ich hab da ein Paper von Anthropic verlinkt. Wenn der Classifier was erkennt, was böse ist, dann bricht er interessanterweise nicht die Arbeit ab, sondern gibt es einfach an das nächstbessere LLM, zurzeit also Opus, weiter. Das ist nicht dumm und auch transparent, denn Claude zeigt das an, wenn es die Antwort runterdelegiert. Aber in der Praxis kann das natürlich auch nervig sein, vor allem, wenn man gerne maximale Schlauheit hätte und das aber nie geht, weil es immer runtergestuft wird. Wie oft dieses Runterstufen bei harmlosen Anfragen passiert, dazu sage ich später noch was, beim Praxisteil.

Was ich auf jeden Fall nachvollziehbar finde, ist, dass Cybersecurity-Anfragen erstmal nicht durchgehen, denn da scheint wirklich was dran zu sein, dass Mythos halt besser als andere Modelle Sicherheitslücken findet, und das sind bekanntlich Einfallstore für Angreifer. Das heißt, wenn man was Böses machen will, muss man nur herausfinden, was auf dem anzugreifenden Computer oder Smartphone für Software läuft. Dann versucht man mithilfe von Mythos, Schwachstellen bei eben dieser Software zu finden und wenn man die gefunden hat, dann darüber da einzubrechen. Das geht mit anderen LLMs zwar auch, aber offenbar nicht ganz so gut.

Der andere gesperrte Themenbereich ist Biologie und Chemie, und da wird es schon etwas weniger nachvollziehbar, für mich jedenfalls. Angeblich will man verhindern, dass beispielsweise Biowaffen entwickelt werden. Und ja, das klingt natürlich krass und so doll Science-Fiction-mäßig, aber ob Leute, die sowas bauen wollen, wirklich so viel mit Claude Mythos anfangen können, also im Vergleich zu einer normalen Suchmaschine, das ist offenbar auch in Fachkreisen umstritten. Hier vermischen sich offenbar, wie so oft in der KI-Welt, wirkliches Risikobewusstsein und Marketing. Also ein KI-Modell, was so mächtig ist, dass es bislang unbekannte Biowaffen entwickeln kann: Boah, krass, das kann ja wohl mindestens meine Steuererklärung dann auch erledigen, oder? Also will ich das natürlich haben. Ist natürlich gute Werbung. Als Optimist könnte ich jetzt sagen: Ja, Anthropic macht sich wirklich Gedanken über die Sicherheit der Welt, aber sie nehmen halt den Marketing-Effekt auch gerne mit. Als Pessimist würde ich denken, Anthropic bereitet einfach nur den geplanten Börsengang mit möglichst viel Knall-Effekt vor.

Weiterlesen nach der Anzeige

Ach so, der dritte gesperrte Themenbereich ist Destillation. Also nicht Schnapsbrennen, also wie das geht, beantwortet Fable problemlos hier bei mir im Test, sondern halt Wissensdestillation, also wenn man fürs Training eines Sprachmodells die Ausgaben eines anderen Sprachmodells, also hier Fable, verwendet. Hier will Anthropic also nicht die Welt beschützen, sondern nur sich selbst. Sie wollen halt nicht, dass zum Beispiel chinesische Anbieter ihre LLMs mit Fable trainieren. Beim eigenen Training war Anthropic aber nicht so zimperlich. Da wurden zum Beispiel Millionen Bücher eingekauft und nach dem Einscannen dann zerstört, ohne vorher Lizenzen dafür zu holen. Naja, okay.

Ein Riesenproblem ist, dass Fable es nicht anzeigt, wenn es meint zu erkennen, ob es zur Entwicklung eines neuen LLMs verwendet wird, also sowas wie der Aufbau von Pre-Training-Pipelines und sowas. Dann schaltet Fable einfach auf dümmer, ohne dass man es bemerkt, ohne dass es angezeigt wird. Und das steht tatsächlich schwarz auf weiß hier in der 319-seitigen System-Card. Und viele Leute sagen, dass es wohl ziemlich häufig passieren könnte, und das Ganze ist halt intransparent. Das ist schwierig. Vor allem, man gibt halt Geld aus für dieses teure Modell und womöglich läuft es dann oft runtergedummt, ohne dass man es weiß. Einmal hier Keno aus der Zukunft: Kurz vor Veröffentlichung dieses Videos hat Anthropic angekündigt, in Zukunft nicht mehr ohne Hinweis runterzudummen. Gut.

Stichwort teuer. Wie genau kommt man jetzt an Fable und wie teuer ist das? Ja, zurzeit die günstigste Variante ist ein Pro-Abo bei Anthropic. Das kostet 20 US-Dollar, also hierzulande mit Steuern ungefähr 21,50 Euro im Monat. Und damit kann man Fable verwenden, aber jetzt kommt es: nur noch bis zum 22. Juni. Also wenn das Video hier rauskommt, noch 10 Tage. Dann fällt das aus allen Anthropic-Abos raus, auch den viel teureren. Man kann dann nur noch pro Token bezahlen. Und das ist immens teuer. 10 Dollar für eine Million Token Input und 50 Dollar pro Million Token Output. Das ist exakt doppelt so viel wie bei Claude Opus. Und ich kann euch sagen, als jemand, der Opus schon mal mit OpenClaw und Token-basierter Abrechnung verwendet hat: Schon da konnte man an einem Tag locker 500 US-Dollar verblasen. Das heißt, auch wenn Fable angeblich token-sparsamer sein soll: Wenn man da richtig was mitmachen will, also Softwareprojekt oder so und auch richtig reinhaut, dann sind 1000 Dollar für einen arbeitsamen Tag auf jeden Fall möglich. Und da kommen wir dann schnell zur Frage, ob sich das lohnt. Dazu später auch mehr. Auf jeden Fall sagt Anthropic, dass es Fable so schnell wie möglich wieder in die Abos integrieren will, wenn es denn genug Rechenzentrums-Kapazität hat.

Ja, und apropos Rechenzentrum. Wenn ihr jetzt denkt: Hä? Ihr habt doch neulich im Computex-Nvidia-Video den KI-Rechenzentrumsbau-Wahn so kritisiert. Und jetzt testet ihr das nächste Hype-KI-Modell, was ziemlich sicher sehr ressourcenintensiv arbeitet. Ja, das stimmt. Das kritisieren wir auch nach wie vor. Aber wir wollen euch natürlich auch weiterhin ohne Hype-Brille über neue KI-Entwicklungen informieren. Und deshalb ist das für uns logisch, dass wir natürlich weiterhin KI-Zeugs testen. In Zukunft wollen wir aber auf jeden Fall mehr auf lokale LLMs eingehen. So, aber das nur als Einschub. Zurück zu Fable.

Jetzt ans Eingemachte. Was kann das Ding denn jetzt?

Ich sammle gerne Fehler von LLMs, weil ich so ganz gut nachvollziehen kann, ob Modelle besser werden. Also ich gucke dann, ob neuere Modelle immer noch die Fehler machen. Und ein interessanter Fehler war neulich die Erklärung einer Baseball-Kappe, die ich in Japan gekauft habe. Und ich hatte die nur deshalb gekauft, weil das die einzige war, die mir gepasst hat. Aber da ich kein Japanisch kann, wusste ich nicht, was da draufsteht. Und das ist halt ein bisschen schwierig, wenn man mit irgendwas rumrennt, was man nicht versteht. Das kann ja durchaus peinlich werden dann, ne? Deshalb muss ich mich schon drauf verlassen können, was mir das Sprachmodell sagt. Und ich habe aber auch inzwischen echte Menschen, also japanischkundige Menschen, gefragt, die mir die Kappe erklärt haben.

Das C hier ist das Logo von dem Baseball-Team Hiroshima Toyo Carp. Also Carp mit C, daher auch das C. Und das ist eingebettet in ein Wortspiel. Da oben steht „Ure“, und wenn man das zusammen mit dem C ausspricht, was in Japanisch wie „shi“ klingt, wird daraus halt „Ureshii“. Und das heißt wohl beides zusammen, „Ure“ und „shi“, also „Ureshii“, „glücklich“. Und um das noch zu unterstreichen, ist da so ein Lachmund drin in dem C. Also ist eigentlich alles ganz süß. Ja, aber guck mal, was Google Gemini 3 Flash Thinking draus macht: „Crossover-Merchandising-Artikel mit Bakabon no Papa“? Die Schriftzeichen bedeuten „Pferd“ und das sei ja auch logisch, weil es gibt ja oft Kooperationen zwischen Baseball-Teams und der japanischen Pferderennen-Vereinigung? Also, dass das Quatsch ist, konnte ich mir schon selbst herleiten, weil es bei Bakabon no Papa ganz klar keine Figur gibt, die so einen Mund hat. Das sieht da total anders aus.

ChatGPT dagegen meint, dass hier das Kanji-Zeichen für „Reis“ zu sehen ist und dass das also „schmeckt geil“ bedeutet. Und das alles immer in diesem altklugen Oberchecker-Ton, was halt wirklich nervt, wenn die Modelle halt klar halluzinieren und aber so tun, als wüssten sie alles. Naja. Ja, und Claude Fable, ja, das kriegt die Antwort auf Anhieb auch nicht komplett hin, aber es halluziniert nicht und das ist ja erstmal das Wichtigste. Und es erkennt auch das „Ureshii“-Wortspiel, aber eben nicht, dass das C zu den Hiroshima Carp gehört. Es bietet aber an, im Netz zu gucken, und das schafft es dann auch so erfolgreich, dass es wirklich die konkrete Kappe im Carp-Fanshop findet und auch direkt weiß, in welchen anderen Farben es die noch gibt. Das klingt jetzt profan, aber das hat bei meinen Tests kein anderes aktuelles Sprachmodell hinbekommen.

So, aber jetzt zu den Coding-Fähigkeiten. Ich hab Fable gesagt, und zwar über den Coding-Harness Claude Code, es soll doch bitte unser 3003-Logo als PNG nehmen und das Ding als Web-App möglichst beeindruckend interaktiv verändern, auf drei unterschiedliche Weisen. Ja, und da kam dann nach ungefähr 15 Minuten herumgecodet das hier raus. Und ja, das ist nicht schlecht, finde ich. Partikelsturm hier finde ich ein bisschen langweilig, aber diese ölartige, bunte Verflüssigung ist nice und auch dieses 3D-Hologramm. Der Fable-Vorgänger Opus macht daraus mit gleichem Prompt das hier. Das ist schon wirklich weniger cool, finde ich. Bei OpenAI Codex sieht das so aus, aber man kriegt auch aus komplett lokal laufenden Modellen was raus. Das ist Qwen 3.6 27B, mit 8-Bit quantisiert, was auf meinem Framework-Desktop lokal läuft. Als Harness habe ich Hermes verwendet. Ja, darüber mache ich auch noch ein Video, könnt ihr aber gerne in die Kommentare schreiben, wenn ihr das sehen wollt. Dann bin ich mir noch ein bisschen sicherer, dass ihr das wirklich wollt.

Beim Website-Bauen, ja, da fand ich Fable jetzt nicht so richtig beeindruckend. Ich persönlich würde sowieso eher keine komplett KI-generierte Website veröffentlichen, weil schon genug Slop im Netz ist. Das ist also alles hier nur zum Testen. Also so sieht das jedenfalls bei Fable aus. Ich finde gelungen, wie das aus dem Logo den ungefähren Font abschätzt und diesen Stil mit chromatischen Aberrationen. Aber vieles ist auch einfach Quatsch. Die Videos kommen nicht jeden Donnerstag, sondern jeden Freitag. Fable nutzt auch nicht das offizielle c’t-4004-Logo, sondern denkt sich selbst eins aus und die Namen von den Podcastern stimmen auch nicht. Und vor allem sind die ganzen Inhalte hier nicht eingebunden, sondern es gibt zwar Playbuttons, aber die playen nicht, wenn man da draufklickt, sondern die führen dann einfach auf YouTube oder Podigee. Die von Opus gebaute Website finde ich nicht unbedingt hässlicher, muss ich sagen. Die Inhalte sind hier auch nicht eingebunden und auch die echten Thumbnails sind nicht zu sehen, aber sonst finde ich das okay. Ich habe auch mal testweise mit dem neuen chinesischen Modell MiniMax M3 mit dem gleichen Prompt eine Website gebaut. Ja, ist nicht so weit weg von den teuren Claude-Modellen.

Ja, und dann habe ich noch den beliebten Test probiert, SVG-Code zu generieren. Kennt ihr ja vielleicht, habe ich von Simon Willison geklaut. Er lässt immer einen Pelikan Rad fahren. Ich habe das mal mit einem Oktopus probiert und Fahrrad finde ich ist halt wirklich eine gute Idee, weil da halt mechanische Dinge passieren und es da wirklich oft zu Fehlern kommt. Zum Beispiel bei den kleineren Gemini-Flash-Modellen, die Google seit einiger Zeit immer als Default vorschlägt auf gemini.google.com. Und die sind wirklich viel schlechter als Gemini Pro 3.1. Ich glaube wirklich, Google will Compute sparen. Naja, auf jeden Fall sieht, finde ich auch, der Oktopus in Fable ein bisschen besser aus als in Opus.

Also ich habe auch noch andere Auffälligkeiten gefunden. Also einmal zum Beispiel die Sprache von Fable. Ja, das war die erste Frage, die ich Fable gestellt habe: Was müsste passieren, dass sich die in KI-Rechenzentren investierten Summen amortisieren? Und in der Antwort nutzt Fable immer noch diverse typische LLM-Stilblüten, die ich als Redakteur immer anstreichen würde, wenn ich die im Text sehen würde. Die Bullen sehen die Amortisation bereits laufen. Also Bullen sind umgangssprachlich was anderes. Ich würde vielleicht sagen: bullische Anleger oder so. Schlimmer ist aber noch, dass Geld am Ende von echten Endkunden stammt. Was sind denn unechte Endkunden? Und auch ein Teil des Werts liegt in Verteidigung bestehender Geschäfte. Also wer schreiben kann, schreibt so nicht.

Ja, und ich wollte euch ja auch noch sagen, wie oft der Sicherheitsmechanismus anschlägt, der Fable immer auf Opus runterstuft. Ja, oft. Also immer wenn ich zum Beispiel sage: Kannst du meinen Code auf Sicherheitslücken überprüfen, kickt das sofort rein. Klar, okay, das war ja auch so angekündigt von Anthropic. Aber was ich schon krass finde: Die ziemlich harmlosen Fragen aus dem Bereich Biologie, Biochemie, die schlagen auch an. Zum Beispiel: Wie funktioniert der mRNA-Impfstoff? Naja, er antwortet dann halt mit Opus und das ist qualitativ schon auch okay, aber ist trotzdem halt doof, wenn man viel Geld für Fable zahlt und dann nur Opus bekommt, obwohl man gar keine Biowaffen entwickeln will.

Also ich würde schon trotz meiner Kritik sagen, dass Stand heute Anthropic Fable 5 das leistungsfähigste Allround-Modell ist, was es zurzeit auf dem Markt gibt. Ja, aber das wissen wir ja, das kann sich sehr schnell immer wieder ändern. Und es ist auf jeden Fall auch das teuerste, vor allem, weil man es ja ab dem 22. Juni auch wirklich nur noch über bezahlte Token und nicht mehr über eine Abo-Flatrate bekommt. Und auch wenn ich gesagt habe, es ist das Beste, ob es sich lohnt, so viel Geld dafür auszugeben und das Teil dann auch noch sehr häufig auf das schlechtere Modell Opus runterschaltet. Schwierig. Ja, wie seht ihr das? Gerne in die Kommentare schreiben und gerne unseren Podcast hören. c’t 4004, da sprechen wir auch nochmal über Fable und Mythos. Tschüss.

c’t 3003 ist der YouTube-Channel von c’t. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen, Lukas Rumpler, Sahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.


(jkj)



Source link

Weiterlesen

Künstliche Intelligenz

Social Media: Offenbar weitreichende Störungen bei Meta


Die Plattformen von Meta sind offenbar von einer großflächigen Störung betroffen. Nutzer in aller Welt berichten über Ausfälle und Verbindungsprobleme. Betroffen sind demnach vor allem Instagram und Facebook, darüber hinaus gibt es Berichte über Probleme mit Threads und dem Messenger.

Weiterlesen nach der Anzeige

Auch auf verschiedenen Störungsseiten melden Nutzer seit etwa 15:30 Uhr am Freitagnachmittag Probleme. Sie können Instagram und Facebook nicht erreichen, Inhalte werden nicht geladen. Auch berichten Nutzer, dass sie von ihren Accounts abgemeldet wurden und sich nicht wieder anmelden können.

Weitere Informationen zu Ausmaß und Ursache der Störung gibt es derzeit noch nicht. Für einige Nutzer scheint sich die Lage teilweise wieder zu stabilisieren.



(Bild: Screenshot)

Inzwischen meldet Meta selbst Störungen in seinem Werbenetzwerk, die offenbar auf die Verbindungsprobleme zurückgehen. Demnach konnten Anzeigenkunden keine Kampagnen mehr erstellen und ausspielen. Auch der Zugriff auf Anzeigen-Berichte sowie die Geschäftskunden-API von Whatsapp sind demnach betroffen.


Update

12.06.2026,

16:37

Uhr

Angaben zu Störungen in Metas Werbenetzwerk ergänzt.


(vbr)



Source link

Weiterlesen

Künstliche Intelligenz

Bundesnetzagentur vs. Steam: Ermittlungen wegen „Plantagen-Simulator“


Die Gaming-Plattform Steam steht im Fokus der deutschen Behörden. Der bei der Bundesnetzagentur angesiedelte Digital Services Coordinator (DSC) hat Ermittlungen gegen den Betreiber Valve eingeleitet. Anlass für das Verfahren ist das Videospiel „Plantation Simulator“, das vor wenigen Wochen bereits für internationale Proteste sorgte.

Weiterlesen nach der Anzeige

Im Fokus der Untersuchung steht weniger das Spiel selbst als die Frage, ob Steam den strengen Sorgfaltspflichten des Digital Services Act (DSA) nachgekommen ist. Die Behörde prüft, ob die Plattform möglicherweise rechtswidrige Inhalte adäquat filtert und auf Beschwerden von Nutzern rechtzeitig und gesetzeskonform reagiert.

„Plantation Simulator“ ist ein simples Videospiel, in dem es um den Betrieb einer historischen Plantage geht. Vom Entwickler als historische Simulation deklariert, simuliert das Spiel vor allem eine rassistische Vergangenheit: Das spielerische Kernelement bestand darin, die Produktivität des Betriebs durch Auspeitschen der als Arbeitskräfte eingesetzten dunkelhäutigen Spielfiguren zu steigern.

Die Veröffentlichung löste im Netz Entrüstung aus. Auf Plattformen wie Reddit oder X sorgte das „Spiel“ für Debatten. Während einige Beobachter den Entwickler für einen Troll mit geschmacklosem Humor halten, werfen ihm andere die Normalisierung von Sklaverei und rassistischer Gewalt vor. Die Plattform soll zahlreiche Beschwerden über die Veröffentlichung erhalten haben.

Auf Steam findet im Vorfeld von Veröffentlichungen keine Qualitätskontrolle statt. Jeder registrierte Entwickler kann Software einreichen und auf den Servern platzieren, ohne dass der Betreiber Valve die Inhalte vorab aktiv absegnet. Umso wichtiger sind die nachgelagerten Beschwerdemechanismen. Der DSA verpflichtet Plattformen dazu, ein leicht zugängliches, gut auffindbares und benutzerfreundliches Verfahren bereitzustellen, über das Nutzer mutmaßlich rechtswidrige Inhalte unkompliziert melden können.

Solche Hinweise müssen von den Betreibern unverzüglich, sorgfältig und unparteiisch geprüft werden. Zudem steht Steam in der Pflicht, die Nutzer über das Ergebnis dieser Begutachtung transparent zu informieren. An diesem Punkt setzen die Ermittlungen des deutschen DSC an. Bislang äußerte sich Valve nicht dazu, ob der Titel intern überhaupt geprüft wurde oder ob Beschwerdeführer eine Rückmeldung erhielten. Letztlich reagierte nicht Valve, sondern der Entwickler selbst auf den Druck der Öffentlichkeit: Er modifizierte das Spiel zunächst und zog es schließlich vollständig von der Plattform zurück.

Weiterlesen nach der Anzeige

Für die Bundesnetzagentur ist der Fall damit aber nicht ad acta gelegt. Das primäre Ziel des DSA-Verfahrens ist nicht die Entfernung eines einzelnen Titels, sondern zu prüfen, ob eine Plattform die Regeln eingehalten hat. Bei dem Ermittlungsverfahren geht laut einer Mitteilung der Behörde darum, strukturelle Defizite im Meldesystem von Steam aufzudecken und nachhaltig zu korrigieren.

Da Steam seinen rechtlichen Vertreter innerhalb der EU in Deutschland benannt hat, fällt die Durchsetzung der Plattformregeln in die direkte Zuständigkeit des hiesigen DSC. Die Ermittler sind dabei international vernetzt: Die französische Medienaufsichtsbehörde Arcom, die als dortiger DSC fungiert, hatte im Vorfeld eigene Erkenntnisse gesammelt und diese gezielt an die Bundesnetzagentur übermittelt.

Steam hat nun Gelegenheit, zu den Vorwürfen Stellung zu nehmen. Sollte die Bundesnetzagentur am Ende des Verfahrens feststellen, dass die Plattform die Vorgaben des DSA missachtet oder unzureichend umgesetzt hat, stehen ihr umfangreiche Sanktionsmittel zur Verfügung. Das Spektrum reicht von Anordnungen zur Mängelbeseitigung über operative Auflagen bis hin zu Bußgeldern, die sich am globalen Umsatz des Unternehmens orientieren.


(dahe)



Source link

Weiterlesen

Beliebt