Künstliche Intelligenz

Meta dekodiert getippte Sätze aus Hirnströmen – ohne Operation


Meta AI’s KI-Modell Brain2Qwerty v2, das getippte Sätze aus nicht-invasiv aufgezeichneten Hirnströmen rekonstruieren kann, hat nun eine Wortgenauigkeit von 61 Prozent erreicht. Damit kommt es der Genauigkeit von Gehirn-Implantaten immer näher.

Weiterlesen nach der Anzeige

Wie die begleitende Studie im Fachjournal Nature zeigt, dekodiert das System aus Magnetoenzephalografie-Daten (MEG) mit einer durchschnittlichen Wortgenauigkeit von 61 Prozent; bei den besten Teilnehmenden sind es 78 Prozent. Mehr als die Hälfte aller Sätze enthält dabei höchstens einen Wortfehler. Das ist sicherlich noch kein alltagstaugliches Ergebnis, aber ein guter Schritt auf dem Weg dahin.

Denn auf solchen Verfahren beruhen große Hoffnungen. Nach aktuellem Stand der Technik müssen für solche Anwendungen Implantate ins Gehirn gesetzt werden. Diese Geräte haben eine hohe Präzision. Ein prominentes Beispiel ist ein ALS-Patient, der ein implantiertes BCI fast zwei Jahre lang nahezu täglich zu Hause nutzte – mit 256 Kontakten im Sprachmotorkortex, einer Kommunikationsgeschwindigkeit von 56 Wörtern pro Minute und über 99 Prozent Wortgenauigkeit bei einem Vokabular von 125.000 Wörtern. Solche Systeme erfordern allerdings neurochirurgische Eingriffe mit entsprechenden Risiken wie Hirnblutungen oder Infektionen. Beim Meta-System wäre das anders.

Ein praktisches Hindernis für den breiten Einsatz bleibt jedoch aktuell noch die MEG-Technologie selbst: Die Geräte benötigen magnetisch geschirmte Räume und sind stationär – für Consumer-Anwendungen oder den häuslichen Einsatz taugen sie vorerst nicht. Erst wenn günstigere Sensorik vergleichbare Signalqualität liefert, dürfte nicht-invasive Sprachdekodierung aus dem Labor in den Alltag gelangen.

Brain2Qwerty arbeitet als dreistufiges Deep-Learning-System. In der ersten Stufe extrahiert ein Modul Merkmale aus den EEG- oder MEG-Rohsignalen, anhand derer das Modell getippte Zeichen erkennen kann. Darauf aufbauend rekonstruiert ein Transformer-Modell die Zeichen- oder Wortfolge. In der dritten Stufe korrigiert ein vortrainiertes Sprachmodell die Roh-Ausgabe – analog zu Sprachmodellen, die bei automatischer Spracherkennung die Fehlerquote senken.

Weiterlesen nach der Anzeige

Für die Studie tippten 35 gesunde Probanden zuvor kurz memorierte Sätze auf einer QWERTY-Tastatur, während ihre Hirnaktivität per Elektroenzephalografie (EEG) oder MEG aufgezeichnet wurde. Visuelles Feedback beim Tippen gab es nicht – die Teilnehmer konnten also nicht sehen, welche Buchstaben sie eingaben.

Die Resultate auf der Grundlage von MEG-Messungen waren dabei deutlich besser als die auf EEG-Grundlage. Meta hat Code und Modelle von Brain2Qwerty als Open Source veröffentlicht.


(rie)



Source link

Beliebt

Die mobile Version verlassen