Connect with us

Künstliche Intelligenz

Missing Link: Tech-Monopole gegen digitale Souveränität an Schulen


Informatikunterricht wird gerade erst nach jahrelangen und zähen Vorbereitungen in einigen Bundesländern in die Schulen gebracht, während des Auftakt-Panels der diesjährigen „Konferenz Bildung Digitalisierung“ wurde allerdings erklärt, dass dieser Unterricht „Unsinn“ ist. Auf dem Podium saßen neben der Moderatorin Katja Weber der netzpolitische Aktivist Markus Beckedahl und Prof. Dr. Caja Thimm, Professorin für Medienwissenschaft und Intermedialität an der Universität Bonn. Sie stimmten die Anwesenden auf das Leitthema „digitale Souveränität“ ein und warben um ein unabhängiges Bildungssystem, das sich der Digitalisierung nicht verschließt, sondern sie national-europäisch gestaltet. Nach dem Panel (Video) konnte heise online Beckedahl und Thimm genauer zu ihren Kernthesen befragen und auch genauer der Frage auf den Grund gehen, weshalb Informatikunterricht „Unsinn“ sein könnte und was er vielleicht doch mit digitaler Souveränität zu tun hat.




Die diesjährige Konferenz des Forum Bildung Digitalisierung lief unter dem Leitthema „Power Up – souverän für die digitale Transformation“ und diskutierte mit Blick auf unsere Bildungslandschaft digitale Souveränität. Es wurde erörtert, wie diese im Bildungssystem verankert werden sollte, aber auch durch Veränderungen im Bildungssystem gesellschaftlich überhaupt erst erreicht werden kann. Die aktuellen Debatten zu einem Handyverbot in Schulen und der Social-Media-Nutzung von Jugendlichen wurden eigentlich in jedem größeren Redebeitrag angeschnitten. Zumeist wurde darauf hingewiesen, dass zumindest in Bezug auf die Social-Media-Nutzung mehr Regulation der Plattformen nötig sei – das Problem übersteige die Ressourcen und Fähigkeiten von Bildungseinrichtungen und Individuen. Mit Blick auf Handyverbote wurde verschiedentlich darauf aufmerksam gemacht, dass Verbote nur dazu führen, dass genau denjenigen Heranwachsenden, die zu Hause keinerlei Medien- oder auch Digitalkompetenz erhalten können, nur der schulische Raum bleibt, um einen reflektierten und sicheren Umgang mit Endgeräten, aber auch den vielfach kritisierten sozialen Medien erlernen zu können.

Die Konferenz konnte mit großen Namen auf ihren Podien aufwarten: Unter anderem waren Bildungsforscher John Hattie, Prof. Dr. Klaus Hurrelmann, Bundesbildungsministerin Karin Prien (CDU), mehrere Landesminister, Bildungsexperten- und -Influencer wie Tarek Zaibi und Fabian Grischkat zugegen.

heise online: Frau Prof. Dr. Thimm, Herr Beckedahl, Sie haben zum Auftakt der Konferenz des Forum Bildung Digitalisierung über digitale Souveränität im Bildungssystem gesprochen – was Sie darunter verstehen, weshalb es sie derzeit nicht gibt und was sich verändern muss. Unter anderem hat Herr Beckedahl die Nutzung von Angeboten großer Akteure wie Microsoft oder Apple in unserem Schulsystem kritisiert und dafür plädiert, dass wir mehr eigene Lösungen aufbauen und auch Open-Source-Angebote stärken. Zugleich haben Sie aber auch die Eigenentwicklung der Lernplattform Logineo in NRW kritisiert. Wie passt das zusammen?


Markus Beckedahl

Markus Beckedahl

Markus Beckedahl ist Mitgründer und kuratorischer Leiter der re:publica-Konferenz. Als Gründer des Zentrum für Digitalrechte und Demokratie arbeitet er an neuen Narrativen für demokratische Zukünfte und entwickelt mit seinem Team gesellschaftliche Strategien, um die Abhängigkeit von Big Tech aufzulösen.

Beckedahl: Zunächst muss uns bewusst sein, dass wir in den letzten 30 bis 40 Jahren einen Monopolbildung im Bildungssystem hatten. Wir haben über eine Generation hinaus Menschen an Microsoft-Produkten geschult. Das war auch recht praktisch. Die kamen dann ins Berufsleben rein und haben im Microsoft-Monopol dort weiter in der Wirtschaft arbeiten können. Mittlerweile wird uns aber bewusst, dass wir uns abhängig gemacht haben von wenigen Unternehmen, die die digitalen Infrastrukturen kontrollieren, die einseitig bestimmen, wie sie funktionieren und die auch jedes Jahr mit Lizenzgebühren immer mehr Geld aus dem Bildungssystem ziehen. Das bedeutet schlussendlich – im übertragenen Sinne – , dass Microsoft nun auch über Nacht entscheiden könnte, dass wir nur noch rückwärts in Toiletten reinlaufen dürfen. Aber das sollten wir so nicht wollen oder fortführen. Wir müssen Infrastrukturen schaffen, die wir kontrollieren und über die wir Kontrolle haben.

Meine Kritik an der NRW-Lösung ist, dass das so schlecht gemacht wurde, dass dann tatsächlich Microsoft wieder als Retter eingesprungen ist. Das ist absurd. NRW hat es also gerade nicht geschafft, eine souveräne, zukunftsfähige Infrastruktur aufzubauen und zu betreiben. Es hat das ganze Großprojekt an die Wand gefahren. Wir leisten uns ins Deutschland durch den Föderalismus aber genau so etwas. Ich würde mir wünschen, dass wir auf Basis von offenen Standards und Open-Source-Software ein Ökosystem schaffen und betreiben würden, auf dem dann die 16 Bundesländer gemeinsam aufbauen können.




Was fehlt: In der rapiden Technikwelt häufig die Zeit, die vielen News und Hintergründe neu zu sortieren. Am Wochenende wollen wir sie uns nehmen, die Seitenwege abseits des Aktuellen verfolgen, andere Blickwinkel probieren und Zwischentöne hörbar machen.

Frau Thimm, Sie hatten sich – trotz der Föderalismuskritik und dem damit einhergehenden Klein-Klein – für mehr Schulautonomie ausgesprochen. Das bedeutet für Sie dann aber nicht, dass jede Schule eine eigene Lösung finden soll, sondern sich Schulen aus einem Software-Pool bedienen können sollen, der auf Bundesebene entwickelt und gefördert wird, so wie Herr Beckedahl das sehen möchte?



Prof. Dr. Caja Thimm ist seit 2001 Professorin für „Medienwissenschaft und Intermedialität“ an der Universität Bonn. Sie hatte Gastprofessuren u.a. in Santa Barbara/USA, Cardiff/Großbritannien und Dijon/Frankeich, war Mitglied mehrerer Enquete-Kommissionen zum digitalen Wandel und ist seit 2024 Mitglied des Verwaltungsrates des WDR. Von 2010-2016 leitete sie das DFG-Projekt „Deliberation im Netz“, von 2017 – 2022 war sie Koordinatorin und Sprecherin des NRW Graduiertenkollegs und des Forschungsverbundes „Digitale Gesellschaft“. Seit 2021 ist sie Mitglied der NRW Akademie der Wissenschaften.

Thimm: Ja, und wir haben eigentlich auch genügend Talente im Land, die so einen Pool aufbauen können. Das sieht man schon allein in der Start-Up-Szene, nicht nur in Berlin. Die Frage ist, was mit dem Geld im Bildungssystem passiert und wo es hinfließt. Nutzen wir unsere Talente und betreiben aktive Förderung der Digitalwirtschaft und machen uns zugleich unabhängiger oder fließt das Geld woandershin? Viele Start-Ups stehen in den Startlöchern, um beispielsweise KI-Produkte für die Bildung zu entwickeln. Aber ob das im Digitalpakt oder dem Sondervermögen berücksichtigt wird, weiß keiner. Vor allem fehlt es auch an Leitlinien für bundesweit einsetzbare Softwareprodukte für den Bildungsbereich. Hier steht uns auch der Föderalismus im Weg. Die 16 Bundesländer müssten hier zumindest Standards setzen, damit so ein Software-Pool dann auch wirklich genutzt werden könnte.

Wenn die Software dann so konzipiert wird, dass Schulen sie nach ihren Bedürfnissen vor Ort anpassen können, wäre schon viel gewonnen. Ich stimme mit Markus Beckedahl auf jeden Fall darin überein, dass wir die Fehler der Vergangenheit nicht fortsetzen oder wiederholen dürfen.

Sie hatten in diesem Zusammenhang auch das Kooperationsverbot erwähnt. Das steht dem Bund dabei im Weg, in Sachen Bildung Länder zu unterstützen oder etwas zu entwickeln.

Thimm: Ja, dieses Verbot steht souveränen und tragfähigen Lösungen oft im Weg.

Frau Thimm, im Vorfeld zur Konferenz hatte Kristin van der Meer, Lehrerin an der Neuen Grundschule Potsdam und auch Referentin der Konferenz, in einem gemeinsamen Pressegespräch mit Ihnen gesagt, dass solche Länder- oder Bundeseigenentwicklungen insoweit unpraktisch oder sogar schlecht sind, weil diese oft in ihren Funktionen begrenzt sind und die Kinder in den Schulen dann nicht lernen, mit den Angeboten zu arbeiten, die sie in ihrer Freizeit nutzen – man kann ihnen dann z.B. nicht im Schulkontext den kritischen Umgang mit ChatGPT beibringen. Kann man solche Angebote also doch nicht ganz aus den Schulen heraushalten?

Thimm: Das sind für mich zwei unterschiedliche Debatten. Schulen können, in kooperativer Absprache mit den Schülerinnen und Schülern, Eltern und Kollegium, den Schulraum kontrollieren, Stichwort Handyverbot in Grundschulen. Die Digitalerziehung im Elternhaus erfordert ganz andere Maßnahmen, da kann es nicht um Verbote gehen.

Ich habe es so verstanden, dass es Frau van der Meer wichtig ist, dass Kinder in der Schule auf die reale Welt vorbereitet werden sollen – auch ganz konkret mit der Hard- und Software, die ihnen dort wirklich zur Verfügung steht. Eigenentwicklungen würden quasi am eigentlichen Bedarf vorbeientwickelt.

Thimm: Ich kann diesen Ansatz nachvollziehen, trotzdem sollten wir hier nicht die Fehler der Vergangenheit wiederholen. Es ist genau die Falle, die uns unter anderem Microsoft seit 40 Jahren stellt.

Beckedahl: Folgen wir dieser Argumentation immer weiter, kommen wir nicht aus dieser Logik raus. Dann heißt es: „Wir verwenden hier überall Microsoft, weil zuhause haben auch alle Microsoft und Microsoft Office.“ Für anderes bleibt dann keine Zeit oder Möglichkeit. Dabei geht es ja eigentlich darum, dass Schülerinnen und Schüler den Umgang mit Textverarbeitungsprogrammen lernen und nicht den Umgang mit einem bestimmten Produkt.

In dem Zusammenhang hat mich eine Aussage von Ihnen gewundert, Frau Thimm. Sie sagten auf der Bühne, dass Informatik-Unterricht „Unsinn“ ist. So, wie er gestaltet würde, werde er nicht gebraucht. Aber ist nicht gerade der Informatikunterricht der Ort, wo Kinder lernen würden, wie Hard- und Software zusammenspielen, was Algorithmen sind, wie man etwa Microcontroller ansteuert, Programme schreibt und auch einen Einblick in die Funktionsweisen von Apps erhält, die ansonsten Blackboxen bleiben? Genau so ein grundlegendes Wissen brauchen wir doch für digitale Souveränität.

Thimm: Wir müssen uns doch fragen: Was für eine Art von „Informatik“ ist hier gemeint und für wen? In einigen Bundesländern ist zum Beispiel auch „Medienbildung“ einbezogen, in anderen nicht. Zudem ist „Informatik“ als Schulfach maßgeblich für die Gymnasien konzipiert, aber die Lehrpläne sehen hier vor allem technische Skills vor, während digitale Ethik, Folgen für Gesellschaft und Individuum wenig Platz haben. In Hessen experimentiert man seit einigen Jahren mit dem Fach „Digitale Welt“, wo Skills mit gesellschaftlichen Fragen kombiniert werden, das sehe ich als eine wichtige Ergänzung an. Nicht zu vergessen ist, dass die Informatikgrundlagen von heute massiv durch KI verändert werden, auch unsere universitären Studiengänge stehen unter hohem Anpassungsdruck. Und ich gehen auch davon aus, dass Schülerinnen und Schüler heute bestimmte Dinge können, die über Klicken und Wischen hinausgehen.

Beckedahl: Hier muss ich widersprechen. Ich glaube schon, dass Schülerinnen und Schüler grundlegende technische Kompetenzen brauchen und verstehen sollten, wie informationstechnische Systeme funktionieren. Das ist bisher vor allem durch die klassischen Mathe- und Physiklehrer abgebildet worden, zumindest war das in meiner Schulzeit so. Vielleicht ist das heutzutage immer noch so und das ist das, was Caja kritisiert: Der Skandal ist, dass die Lehrkräfte-Ausbildung nicht das bringt, was wir eigentlich bräuchten – auch nicht für ein Fach Informatik. Wir müssen viel struktureller ansetzen.

Thimm: Genau! Wenn es ein Schulfach Informatik gibt, das wissenschaftlich weiterentwickelt wird und innerhalb der universitären Forschungslandschaft auch unter pädagogischen Aspekten konzipiert wird, dann braucht man eben auch eine breitere Diskussion über die Inhalte und mehr Mittel für solche Lehrstühle an den Universitäten. Ich gebe zudem zu bedenken, dass Schulinformatik den rasanten technologischen Wandel wirklich abbilden muss, und hier bin ich doch sehr skeptisch, ob das eine realistische Perspektive ist. Und ob und wie lange man z.B. noch Grundlagen des Programmierens braucht, denn die Prüfung komplexer Algorithmen würde die Schulinformatik sicher überfordern, ist doch angesichts der frappierenden Kompetenzen der LLMs in diesem Bereich wirklich fraglich. Diese Problematik haben wir ja sogar inzwischen im Studienfach Informatik an den Hochschulen, wo die Inhalte teilweise angepasst werden müssen.

Einer Ihrer Punkte auf dem Podium war, dass Schülerinnen und Schüler gewisse Dinge aus einem Informatikunterricht nicht mehr lernen müssen, weil KI mittlerweile diese Programmieraufgaben übernimmt. Deshalb sollten wir aber doch Programmieren und Grundlagen des Programmierens nicht aus dem Unterricht streichen? Souveränität bedeutet schließlich auch, dass Menschen noch Code verstehen und als Kontrollinstanz auftreten können, da KI Fehler macht und schon allein die Trainingsdaten diskutabel, zum Beispiel unvollständig und biased sein können. Auch Algorithmusverständnis ist essenziell. Dass heutige Kinder schon per se durch regelmäßige Techniknutzung mehr als nur „Klicken und Wischen“ können, sehe ich auch nicht unbedingt bestätigt, wenn ich ihnen begegne. Kommen wir aber zu einer anderen Frage: Sie haben beide kritisiert, dass in der Öffentlichkeit stets von Medienkompetenz gesprochen wird, beziehungsweise diese als Unterrichtsziel verlangt wird. Welche Kompetenzen sollten es stattdessen sein?

Beckedahl: Das, was wir eigentlich brauchen, sind Digitalkompetenzen. Wenn ich Medienkompetenz höre, dann hat das für mich vor allem etwas mit klassischen Medien zu tun, aber nichts mit den vielen anderen Aspekten, die zum Verständnis des Digitalen nötig sind.

Thimm: Dem kann ich so nur zustimmen. Digitalkompetenz beinhaltet für mich Fähigkeiten zum selbstbestimmten Umgehen mit und im Digitalen. Deshalb bin ich auch für eine Begriffsanpassung.

Frau Thimm, Sie haben in Ihrem Input zur Diskussion auch auf die Gefahr von „Technofaschismus“ hingewiesen. Unser Föderalismus oder auch gezielte Parallelstrukturen, sollen in Deutschland ein Sicherheitsnetz darstellen, damit Systeme nicht auf einen Schlag übernommen werden können. Was bedeutet das für Sie in Bezug auf Regulation oder Strukturreformen?

Thimm: Zunächst möchte ich, wie auch in meinem Input, darauf verweisen, dass wir in Deutschland mit den Begriff „Faschismus“ sehr bedacht umgehen müssen. Aber diese Debatte um einen „Digitalfaschismus“, die aus den USA kommt, wird nun auch zunehmend bei uns reflektiert. Um Digital-Eliten beziehungsweise mächtige Monopolstrukturen mit massivem politischen Einfluss zu verhindern, sind schützende Strukturen sinnvoll. Wie Markus aber zurecht erklärt hat, darf das in Deutschland auch nicht dazu führen, dass wir hier nichts mehr gestalten oder verändern können. Auf europäischer Ebene sehe ich aber auf jeden Fall Handlungsbedarf, um Abhängigkeiten und systemische Gefahren zu begrenzen. Wir sehen, dass es mittlerweile eine irrsinnige Machtkonzentration im Tech-Sektor gibt und da sollte unter anderem der AI-Act schlagkräftig drauf reagieren können. Dass beispielsweise in den USA gerade von einem Gericht entschieden wurde, dass Google nicht zerschlagen werden muss, sollte ein Alarmzeichen sein.

Sie sagten beide, dass jetzt die Zeit ist, in der wichtige Weichenstellungen erfolgen könnten – unter anderem durch den Digitalpakt 2 und das Sondervermögen. Wie diese genau eingesetzt oder gestaltet werden, ist noch offen.

Beckedahl: Ja, es gibt zumindest die Hoffnung, dass wir jetzt ein Momentum zum Handeln haben. Wir könnten jetzt in souveräne digitale Infrastrukturen investieren, sowohl in die Software, als auch in die Bildung zu mehr Souveränität. Die Gefahr ist, dass Politiker:innen das nicht ausreichend auf dem Schirm haben und sich wieder in Großlizenzierungen hineinquatschen lassen und wir weiter gefährlich abhängig bleiben.

Thimm: Hier gibt es eine Chance – dazu kann und soll auch die Konferenz des Forum Bildung Digitalisierung beitragen. Ich halte übrigens die aktuelle Handyverbotsdebatte in diesem Zusammenhang sogar für einen sinnvollen Weckruf. Auch wenn wir Ungenauigkeiten oder Polarisierungen in der Debatte sehen, geht damit doch auch eine öffentlich breit geführte Diskussion einher. Gefahren für Kinder und Jugendliche werden benannt, Aspekte von „Digitalkompetenz“ diskutiert und damit kommt auch „digitale Souveränität“ auf die Agenda.


(kbe)



Source link

Künstliche Intelligenz

„Armut tötet“: Warum „KI“ das Gesundheitswesen nicht retten kann


Auf dem 39. Chaos Communication Congress analysierte Manuel Hofmann von der Deutschen Aidshilfe in seinem Vortrag „‘KI’, Digitalisierung und Longevity als Fix für ein kaputtes Gesundheitssystem?“ die überzogenen Technologie-Versprechen für das deutsche Gesundheitssystem. Sein Vortrag offenbarte eine gefährliche Mischung aus naiver Technikgläubigkeit, libertärer Ideologie und dem systematischen Ausblenden sozialer Ungleichheiten.

Weiterlesen nach der Anzeige

Betrachte man die Schlagzeilen, stecke das deutsche Gesundheitswesen in einer veritablen Krise: Die Kosten explodieren, der demografische Wandel rollt unaufhaltsam auf das System zu, und in den nächsten zehn bis fünfzehn Jahren werden Hunderttausende Beschäftigte in Rente gehen. Zugleich kommen geburtenstarke Jahrgänge in ein Alter, in dem sie häufiger krank und pflegebedürftig werden. Der Charité-Chef warne vor dem Kollaps, der GKV-Spitzenverband schlage Alarm, und Deutschland lande bei der Krankheitsprävention auf dem vorletzten Platz einer internationalen Erhebung.

Die Antwort der Politik und der Gesundheitswirtschaft auf diese strukturellen Probleme folge einem erstaunlich einheitlichen Muster, erklärte Hofmann: Technologie soll es richten. In der Digitalisierungsstrategie des Bundesgesundheitsministeriums (PDF) aus dem Jahr 2023 heiße es: „Die Digitalisierung in der Gesundheits- und Pflegeversorgung ermöglicht ein gesünderes und längeres Leben für alle.“ Doch wie realistisch sind diese Versprechen tatsächlich?

In seiner Analyse verdeutlichte Hofmann die Dimensionen der Realitätsferne mit konkreten Aussagen führender Gesundheitsmanager. Prof. Dr. Heyo K. Kroemer, Vorstandsvorsitzender der Charité – Europas größtem Universitätsklinikum –, erklärte demnach in einem Tagesthemen-Interview, dass innerhalb der nächsten zehn Jahre ein Drittel seiner Mitarbeiter in Rente gehen werde. Hofmann zitierte Kroemers Schlussfolgerung: „Insofern haben wir ganz klar die Zielsetzung, innerhalb einer Dekade ein Drittel der Mitarbeiter durch diese Technologien ersetzen zu können.“

Hofmann konterte diese Aussage mit Verweis auf die Geschichte der Digitalisierung im Gesundheitswesen: „Ich erinnere noch mal daran: Wir haben vor 20 Jahren die erste Idee zur elektronischen Patientenakte bekommen.“ Die elektronische Patientenakte, das Vorzeigeprojekt der Gesundheitsdigitalisierung, war auf dem Chaos Communication Congress vor genau einem Jahr Gegenstand vernichtender Kritik – Sicherheitsforscher hatten zahlreiche technische Mängel aufgezeigt. Vor diesem Hintergrund erscheine die Vorstellung, innerhalb von zehn Jahren ein Drittel des Krankenhauspersonals durch KI zu ersetzen, geradezu unrealistisch, so Hofmann.

Noch weiter gehe es in einem von Siemens Healthineers gesponserten Meinungsbeitrag in der Welt, den Hofmann in seinem Vortrag zitierte: „Was können wir dagegen tun? Wir können nicht mehr Ärzte herbeizaubern, aber durch den Einsatz von Technologie versetzen wir sie in die Lage, künftig zehnmal mehr als heute zu leisten. Warum sollte ein Arzt, der heute 1000 Patienten im Quartal behandelt, künftig nicht 10.000 Patienten im Quartal behandeln?“

Weiterlesen nach der Anzeige

Hofmann berichtete, er habe diese These bei einem Workshop auf einem Ärztekongress des Vereins Demokratischer Ärztinnen getestet. Die Reaktion der anwesenden Mediziner auf die Frage, warum sie künftig nicht zehnmal so viele Patienten behandeln könnten, beschrieb er so: „Sie waren so mittelbegeistert und haben sich auch tendenziell nicht über zu laxe Arbeitsbedingungen beschwert.“

Besonders drastisch illustrierte Hofmann die Weltfremdheit mancher Zukunftsvisionen anhand eines Magazins einer Strategieberatung, das das Gesundheitswesen im Jahr 2030 beschreibt. Die dort geschilderte Szene: Ein Patient sitzt in einer onkologischen Praxis, um seine Krebsprognose zu erfahren – also die Antwort auf die Frage, ob er weiterleben wird. Dieser Patient werde in der Vision als „neugierig“ beschrieben, so Hofmann.

Seine Kritik fiel deutlich aus: „Ich will wirklich nicht, dass die Zukunft unseres Gesundheitswesens von Leuten designt wird, die denken, dass Menschen, die gerade erfahren, ob sie weiterleben können, neugierig in ihrem Behandlungsgespräch sitzen.“ In der Vision errechneten KI-Simulationen, „gestützt auf Quantencomputing“, eine individualisierte Erfolgswahrscheinlichkeit. Die Ärztin habe dann auch viel mehr Zeit für „tolle psycho-onkologische Gespräche“, weil das Administrative wegfalle. Die Diskrepanz zwischen solchen Hochglanz-Szenarien und der Realität eines Gesundheitssystems, das noch immer massiv auf Faxgeräte angewiesen ist, könne kaum größer sein.

Parallel zur Technologie-Euphorie etabliere sich laut Hofmanns Analyse ein zweites Narrativ: die Betonung von Eigenverantwortung. Der Referent verwies auf Bundeskanzler Friedrich Merz, der beim Kongress der Maschinenbauer erklärt habe, die Deutschen gingen alle zu häufig zum Arzt.

Ähnlich äußere sich Bundesgesundheitsministerin Nina Warken. Hofmann zitierte sie aus einer Pressekonferenz zum Public Health Report: „Um eine finanzierbare und gute Gesundheitsversorgung für die Zukunft aufzustellen, sind Veränderungen unumgänglich. Und dabei wird auch die Eigenverantwortung der Bürgerinnen und Bürger eben eine zentrale Rolle spielen.“

Diese Entwicklung münde in eine zunehmende digitale Ersteinschätzung, analysierte Hofmann: Bevor Menschen Zugang zum Gesundheitssystem erhalten, sollen Chatbots und Symptomchecker vorfiltern, wer „wirklich“ behandelt werden muss.

Besonders problematisch werde diese Entwicklung im Bereich der psychischen Gesundheit. Angesichts des Mangels an Psychotherapieplätzen werde KI zunehmend als Ersatz diskutiert. Hofmann warnte eindringlich: „Nein, ChatGPT wird nicht den Psychotherapeuten und die Psychotherapeutin ersetzen.“ Als Beleg verwies er auf ein neues Phänomen: die KI-induzierte Psychose. Menschen mit bestehenden Zwangsgedanken erhielten von Sprachmodellen oft bekräftigende Antworten, die ihre Probleme verschärften statt sie zu lindern.

Ein weiterer Strang von Hofmanns Analyse betraf die Longevity-Bewegung – ein Ansatz, der Langlebigkeit durch eine Kombination aus Technologie, Selbstoptimierung und experimentellen Behandlungen verspricht. Die ideologischen Wurzeln dieser Bewegung lägen im Silicon Valley, bei Tech-Milliardären mit libertären Überzeugungen und dem ausgeprägten Wunsch, nicht sterben zu müssen.

Als prominenten Vertreter nannte Hofmann Ray Kurzweil, KI-Visionär und Chief Technical Officer bei Google. Kurzweil propagiere das Konzept der „Longevity Escape Velocity“ – den Punkt, an dem der medizinische Fortschritt so schnell voranschreite, dass jedes gelebte Lebensjahr ein zusätzliches Jahr Lebenserwartung bringe. Hofmann erläuterte Kurzweils Vision: Man erreiche irgendwann einen Zustand, „wo wir unsere allzu schwächlichen scheiternden Körper hinter uns lassen können“ und wo Krankheit, wie wir sie kennen, ausgerottet werde. Nach Kurzweils Prognosen werde dieser Punkt bereits in wenigen Jahren erreicht sein. „Ich glaube, das Fax wird im deutschen Gesundheitswesen diesen Zeitpunkt um einige Jahrzehnte überleben,“ sagte Hofmann dazu.

Die praktische Ausprägung dieser Ideologie finde sich in Einrichtungen wie Fountain Life, einem laut Hofmann „irrsinnig teuren Longevity-Center“ in den USA, wo wohlhabende Kunden experimentelle Untersuchungen buchen können. Ein Gründer von Fountain Life habe empfohlen, man solle „der CEO der eigenen Gesundheit sein“ – eine Formulierung, die inzwischen auch von deutschen Gesundheitsinfluencern übernommen werde.

Als besonders skurriles Beispiel nannte Hofmann den Longevity-Enthusiasten Brian Johnson, der sich selbst als den bestvermessensten Menschen der Welt bezeichne. Johnson sei bekannt für obsessive Selbstvermessung, die nach Hofmanns Darstellung bisweilen groteske Züge annehme. Er verwies auf einen Artikel der New York Times, der die jahrhundertealte Suche nach dem ewigen Leben analysiert und festgestellt habe, dass diese Suche überwiegend von Männern getrieben ist. Hofmann zog Verbindungen zu sozialpsychologischer Forschung, die nahelege, dass die Verdrängung des Todes in individualistisch organisierten Gesellschaften deutlich verbreiteter sei als in gemeinschaftsorientierten Kulturen.

Das fundamentale Problem all dieser Ansätze sah Hofmann in ihrer systematischen Ausblendung sozialer Ungleichheiten. Gesundheit hänge in hohem Maße von gesellschaftlicher Positionierung ab, betonte er in seinem Vortrag. Menschen, die queer oder trans seien, erlebten ihr Leben lang Minderheitenstress, der sich auf die Gesundheit auswirke. Menschen, die täglich zehn Stunden Pakete austrügen, hätten abends keine Energie mehr für Wellness-Rituale. „Armut tötet“, fasste Hofmann zusammen – eine Aussage, die das Robert-Koch-Institut mit seinen Daten zur „Lebenserwartungslücke“ zwischen Arm und Reich wissenschaftlich bestätige.

Die Individualisierung von Gesundheit mache Menschen für Dinge verantwortlich, für die sie wenig könnten, argumentierte Hofmann. Wer in einer lauten Straße wohne, wer Schichtarbeit leiste, wer prekär beschäftigt sei, könne sich nicht einfach für einen gesünderen Lebensstil entscheiden.

Besonders eindringlich wurde Hofmann bei der globalen Dimension. Die Deutsche Aidshilfe habe anlässlich des Welt-Aids-Tags einen Weckruf veröffentlicht: Nach dem Rückzug der USA aus internationalen HIV-Programmen drohe eine Katastrophe. Menschen würden an einer gut behandelbaren Krankheit sterben, weil ihnen die Medikamente fehlen. Hofmann appellierte: „Vielleicht sollten wir das Problem mal als erstes fixen, bevor wir uns weiter darüber unterhalten, ob irgendwelche Tech-Bros aus dem Silicon Valley 130 werden könnten.“

In seinem Vortrag warnte Hofmann auch vor den politischen Implikationen der Krisendiskurse. Die Erzählung, dass das Gesundheitssystem kaputt sei, sei keine neutrale Zustandsbeschreibung, sondern selbst ein Narrativ. Natürlich müsse man Probleme benennen und Lösungen diskutieren. „Aber wenn man nur die Erzählung macht, dass das System kaputt geht und eh alles den Bach runter geht und wir dem Untergang geweiht sind, dann profitiert am Ende doch wieder nur die eine rechtsextreme Partei, die selbst ganz bestimmt keine kompetenten, weitsichtigen Antworten für strukturelle Probleme im Gesundheitswesen haben wird.“


(mack)



Source link

Weiterlesen

Künstliche Intelligenz

Mecklenburg-Vorpommern: Land will schnellere Digitalisierungsverfahren


Die Digitalisierung in Mecklenburg-Vorpommern soll mit vereinfachten Verfahren weiter beschleunigt werden. Durch Änderungen in der Landesbauordnung, dem digitalen Bauantrag und dem Breitbandportal könnten Planungen und Genehmigungen zunehmend schneller abgewickelt werden, hieß es in einer Mitteilung des Innenministeriums in Schwerin.

Weiterlesen nach der Anzeige

„Wir haben heute Möglichkeiten, die uns vor Jahren noch gefehlt haben. Wenn wir sie alle konsequent nutzen, kommen wir deutlich schneller voran“, sagte Innenminister Christian Pegel (SPD).

2015 startete der Bund laut Ministerium das erste Förderprogramm für Glasfaserausbau. Mittlerweile könnten mehr als 60 Prozent der Haushalte im Nordosten einen Glasfaseranschluss nutzen, mit denen sie schnelleres Internet haben. Laut Pegel wurde bislang etwa die Hälfte der Fördermittel in Höhe von fast drei Milliarden Euro abgerufen.

Im September endete nach mehr als sieben Jahren Bauzeit ein großes Ausbauprojekt des Glasfasernetzes im Landkreis Vorpommern-Rügen. Davon profitieren nach früheren Angaben des Landkreises fast 60.000 Haushalte, darunter 1.800 Unternehmen und 80 Schulen in 56 Kommunen des Landkreises. Das Projekt wurde mit Gesamtkosten von knapp 127 Millionen Euro von Bund, Land und Landkreis gefördert.

Unter anderem die CDU hatte in der Vergangenheit kritisiert, dass zu wenige Haushalte im Nordosten Glasfaser haben. Mittelabflüsse aus Förderprogrammen seien hoch, doch beim tatsächlichen Ausbau hinke das Land weiter hinterher, kritisierte der Vorsitzende der CDU-Landtagsfraktion, Daniel Peters, vor mehreren Monaten.

Weiterlesen nach der Anzeige


(kbe)



Source link

Weiterlesen

Künstliche Intelligenz

Meta liefert mit SAM die Augen für multimodale Sprachmodelle


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

SAM steht für „Segment Anything Model“. Mit diesem KI-Modell ist es möglich, Objekte und sogar Audio aus Bildern und Videos zu segmentieren – einfach per Prompt. Die neueste Version von SAM – SAM 3 – ist in drei Varianten verfügbar: SAM 3, SAM 3D und SAM 3 Body. Wir haben mit Nikhila Ravi, Forschungsingenieurin bei Meta, über Anwendungsfälle und die Funktionsweise von SAM gesprochen.

Weiterlesen nach der Anzeige

Was genau ist SAM? Ist es ein neues Modell? Ist es generative KI? Es handelt sich nicht um ein großes Sprachmodell an sich.

SAM ist also eigentlich eine Reihe von Modellen, die wir in den vergangenen vier Jahren entwickelt haben. Wir haben am Projekt „Segment Anything” gearbeitet. 2023 haben wir SAM1 veröffentlicht. Mit SAM1 kann man auf ein Objekt zeigen oder klicken, woraufhin das Modell die pixelgenaue Grenze des angeklickten Objekts vorhersagt. SAM1 war nur für Bilder gedacht. Im Jahr 2024 haben wir dann SAM2 veröffentlicht, das dasselbe tat, aber in Videos. Jetzt können Sie auf ein Objekt klicken und erhalten die pixelgenaue Begrenzung dieses Objekts in jedem einzelnen Frame des Videos. SAM3 ist ein völlig neues Modell, bei dem Sie nun mit Text oder visuellen Beispielen angeben können, was Sie umreißen möchten.


Nikhila Ravi

Nikhila Ravi

Nikhila Ravi, Research Engineer bei Meta FAIR.

(Bild: [Link auf https://www.nikhilaravi.com/])

Damit meine ich, dass man beispielsweise nicht mehr auf jede einzelne Person klicken muss, sondern einfach den Text „Person“ eingeben kann und das Modell automatisch jede einzelne Person findet und die Grenze um sie herum zeichnet. Wir haben also eine völlig neue Schnittstelle geschaffen, um Segmentierungen vornehmen zu können.

Der entscheidende Unterschied zu generativen Modellen besteht vielleicht darin, dass SAM eine pixelgenaue Wahrscheinlichkeit vorhersagt, ob dieses Pixel zum Zielobjekt gehört. Es generiert keine neuen Pixel, sondern markiert sozusagen mit einem Textmarker etwas, das bereits im Bild vorhanden ist.

Man kann einfach „Person” sagen, oder einen anderen Prompt schreiben, und SAM findet die Person im Bild. Gibt es in SAM so etwas wie ein großes Sprachmodell, das für diesen Prozess verwendet wird?

Das ist eine gute Frage. Eines der Dinge, die wir unbedingt erreichen wollten, war die Implementierung einer solchen offenen Vokabular-Textschnittstelle. Aber wir haben uns dann doch dafür entschieden, uns auf kurze Textphrasen zu beschränken. „Person“ ist also ein sehr einfaches Beispiel. Man kann auch komplexere Dinge wie „gelber Schulbus“ oder „rot gestreifter Regenschirm“ eingeben. Es sind jedoch nur zwei oder drei Wörter möglich, also kurze Phrasen. Der Grund dafür ist, dass wir kein großes Sprachmodell innerhalb des Modells verwenden wollen, sondern einen kleinen Text-Encoder haben.

Weiterlesen nach der Anzeige

Denn wir verwenden SAM3 für viele Anwendungsfälle in der Praxis, darunter auch für einige Produkte bei Meta, und es muss schnell sein. Wir hätten uns auch für ein LLM entscheiden können, aber wir haben uns dafür entschieden, es auf diese kurzen Phrasen zu beschränken, damit wir es auch für Produktanwendungen schnell ausführen können.

Ich habe den Playground ausprobiert, eine Art Bild und Video-Editor, und es hat sehr viel Spaß gemacht. Aber wofür wird SAM noch verwendet?

Die präzise Bild- und Videobearbeitung ist definitiv ein Anwendungsfall, den wir im Playground hervorgehoben haben, und den wir intern für etwa Instagram Edits und andere Produkte verwenden. Intern verwenden wir es auch für die visuelle Datenbeschriftung, also das Datalabeling. SAM1 und SAM2 haben die Datenbeschriftung erheblich beschleunigt. Früher musste man die Begrenzung um das Objekt manuell zeichnen. Mit SAM1 konnte man einfach auf das Objekt klicken und erhielt die Begrenzung. Aber wenn beispielsweise fünf Hunde im Bild waren, musste man manuell auf jeden der fünf Hunde klicken. SAM3 ist wie ein weiterer Schritt zur Beschleunigung dieses Prozesses, denn jetzt kann man einfach „Hund” eingeben und erhält Masken für alle Hunde. Im Rahmen der Einführung von SAM3 haben wir unter anderem mit einem Datenkennzeichnungsunternehmen namens Roboflow zusammengearbeitet. Roboflow ist ein Unternehmen für visuelle Datenkennzeichnung, das SAM1, SAM2 und jetzt auch SAM3 integriert hat.

Das Unternehmen ist begeistert davon, wie sehr SAM die Workflows für die Kunden beschleunigen kann, und zwar in gannz verschiedenen Anwendungsfällen aus der Praxis. In der Medizin beispielsweise müssen manche Wissenschaftler Zellen zählen, genauer gesagt müssen sie manuell zählen, wie viele Zellen sich auf einem Objektträger befinden. Mit SAM3 können Sie jetzt einfach einen Textbefehl wie „Zelle” verwenden oder ein Beispielfeld zeichnen. Eine weitere Möglichkeit, etwas zu spezifizieren, besteht nämlich darin, ein Feld um ein Beispiel zu zeichnen, woraufhin SAM3 alle anderen Beispiele findet.

Es gibt auch industrielle Anwendungsfälle. Die Robotik ist ein weiterer wichtiger Anwendungsbereich, der derzeit im Vordergrund steht. Besonders interessant sind die Videofunktionen und der Echtzeitaspekt, da man beim Navigieren in einer Umgebung alle verschiedenen Objekte finden muss. Wenn man beispielsweise einen Roboter hat, der Objekte aufnehmen kann, muss man wissen, wo sich die Objekte befinden.

Datenbeschriftung kann für alles Mögliche verwendet werden. Zum Beispiel in einer industriellen Fertigungslinie, in der eine neue Komponente hergestellt werden soll und man zählen möchte, wie viele Komponenten produziert werden.

Früher mussten Menschen alles anklicken und beschreiben, heute ist das also viel einfacher und schneller, nicht wahr?

Ja. Es ist wie eine Automatisierung dieses Prozesses. Früher musste man alles manuell machen. Jetzt können wir dieses Modell in den Kreislauf einbinden, man nimmt vielleicht ein paar Korrekturen vor, aber dann sind 80 % der Vorhersagen ungefähr richtig. Das beschleunigt den gesamten Prozess.

Jetzt haben wir SAM im Playground als Editor, wir haben SAM für die Datenbeschriftung. Entwickler können SAM3 frei verwenden. Wie geht es weiter? In welche Richtung arbeiten Sie?

Der Forschungsteil ist wirklich grundlegend. Wir betrachten es gerne unter dem Gesichtspunkt: „Was ist eine grundlegende Innovation, die dann viele neue Anwendungsfälle nachgelagert ermöglicht?“ Die Anwendungsfälle im Bereich der Bearbeitung machen Spaß. Aber all diese Anwendungsfälle aus der Praxis zeigen vor allem, dass das Modell über Generalisierungsfähigkeiten verfügt.


SAM erkennt Käse, Brettchen, und andere Kleinteile auf einem Tisch.

SAM erkennt Käse, Brettchen, und andere Kleinteile auf einem Tisch.

Alle Objekte eines Bildes werden erkannt.

Die Entwicklertools, sozusagen der Code und die Modelle, veröffentlichen wir, weil wir von der Community profitieren, die darauf aufbaut. Einige der Dinge, die die Community auf SAM2 aufgebaut hat, haben wir tatsächlich für SAM3 verwendet. Es handelt sich um neue Benchmarks und einige Modellverbesserungen, die die Open-Source-Community vorgenommen hat. Und es gab einige neue Datensätze, die die Community erstellt hat.

Deshalb halten Sie an der offenen Strategie fest, richtig?

Ja, für SAM war es wirklich sehr wirkungsvoll, diese Komponente zu haben.

Was ist das nächste größere, vielleicht grundlegende Problem? Gibt es ein größeres Ziel, auf das Sie hinarbeiten?

Ich denke, eines der Dinge, die wir in der SAM3-Veröffentlichung gezeigt haben, ist, wie SAM3 mit MLLM, multimodalen großen Sprachmodellen, eine visuelle Grundkomponente sein kann. SAM3 ist beispielsweise sehr gut in der Lokalisierung, also der Vorhersage der pixelgenauen Maske, während MLLMs sehr gut im Schlussfolgern und Planen sind und über all dieses zusätzliche Wissen über die Welt verfügen. Wir haben bereits gezeigt, wie man ein MLLM mit SAM3 kombinieren kann, um komplexere visuelle Aufgaben zu lösen. SAM3 ist also so etwas wie die Augen, das MLLM ist wie das Gehirn, und sie arbeiten zusammen. Dieses Experiment haben wir bei der SAM-3-Veröffentlichung vorgestellt. Ich denke, das ist definitiv eine sehr interessante Richtung für die Zukunft.

Und glauben Sie, dass dies für eine AGI (Artificial General Intelligence) oder eine AMI (Artificial Machine Intelligence) oder eine Superintelligenz oder etwas in der Art notwendig ist?

Auf jeden Fall für die Robotik. Die Robotik ist ein gutes Beispiel, weil sie viele verschiedene Anwendungsfälle umfasst: Etwa um verkörperte Agenten zu haben, die sich in der Welt bewegen und dann Aufgaben ausführen können, die die Lokalisierung und Verfolgung von Objekten erfordern. Da ist es eine enorm wichtige Fähigkeit. Und ganz allgemein: Wie kann man Vision und Sprache enger miteinander verbinden? Denn wie Sie wissen, ist die Menge an visuellen Daten, die wir in der Welt haben, deutlich größer als die Menge an Textdaten. Es ist entscheidend, visuelle Inhalte so tiefgreifend wie Textdaten verbinden und verstehen zu können. Wir brauchen die Augen, und die Augen sind im Moment im Vergleich zu den menschlichen Augen noch sehr primitiv.

Was können wir in naher Zukunft erwarten?

Es gibt einige kurzfristige Ziele, die wir erreichen möchten, beispielsweise das Modell etwas schneller zu machen. Derzeit ist es bei Bildern sehr schnell. Bei Videos ist es für etwa fünf Objekte in Echtzeit schnell, aber dann skaliert die Inferenzzeit mit der Anzahl der Objekte. Wir haben also einige Ideen, wie wir die Inferenz schneller machen können. Es gibt ein paar Dinge, die wir umsetzen möchten und die leicht zu erreichen sind.

Ich habe mich gefragt, ob klassische Freisteller, vielleicht für Produkte in Online-Shops, ein Anwendungsfall sind? Oder ist das für SAM viel zu einfach? Es gibt ja auch SAM 3D.

SAM 3D ist ein separates Modell. Wir haben also tatsächlich drei verschiedene Modelle veröffentlicht. SAM 3, SAM 3D Objects und SAM 3D Body. Für den von Ihnen genannten Anwendungsfall könnten SAM 3 und SAM 3D Objects eine gute Lösung sein. Wir haben dies tatsächlich mit Facebook Marketplace umgesetzt. Wir haben eine Funktion entwickelt, mit der jeder Verkäufer von Wohnaccessoires auf Facebook Marketplace die Möglichkeit hat, sein Angebot in ein 3D-Objekt umzuwandeln, das der Käufer dann in Augmented Reality betrachten kann. Dabei wird SAM 3 verwendet, um das Objekt zu maskieren, und dann mit SAM 3D in 3D umgewandelt. Das war ein Projekt, an dem ich besonders gerne mitgearbeitet habe, weil ich glaube, dass wir uns so etwas vor fünf Jahren noch nicht hätten vorstellen können, und jetzt können wir es tun.


Ein Sessel wird mittels Prompt zum 3D-Objekt.

Ein Sessel wird mittels Prompt zum 3D-Objekt.

Ein Sessel wird mittels Prompt zum 3D-Objekt.

(Bild: Meta)

Und wo liegen die Grenzen? Ich glaube, ich habe gelesen, dass die Hände das Problem für SAM 3D Body sind. Es sind immer die Hände.

Es gibt unterschiedliche Einschränkungen für verschiedene Modelle. Ich denke, die Einschränkung des SAM 3-Modells liegt eindeutig in den kurzen Textphrasen. Das ist etwas, das wir hoffentlich lösen können. Es gibt auch sehr nischenhafte Bereiche, die spezielles Wissen erfordern. Zum Beispiel die Interpretation von Röntgenbildern. Wir haben dieses Wissen nicht in das Modell integriert, da wir keine Daten dafür haben. Für solche Anwendungsfälle müssen also Daten gesammelt und das Modell feinabgestimmt werden. Wir bieten jedoch Anweisungen zur Feinabstimmung in der Code-Veröffentlichung für SAM 3. Bei SAM 3D gibt es die genannten Handrekonstruktion. Es gibt außerdem Bemühungen, die Geschwindigkeit der SAM 3D-Modelle zu verbessern, damit auch sie schneller laufen können.


(emw)



Source link

Weiterlesen

Beliebt