Connect with us

Künstliche Intelligenz

Studie: ChatGPT analysiert Ultraschallsignale für effizienteres Tracking in VR


Ein Forschungsteam der Hong Kong Baptist University hat ein neues Verfahren zur Gestenerkennung in Virtual-Reality-Umgebungen vorgestellt. Die Methode soll Bewegungen ohne Trackingkamera, spezielle Sensoren oder umfangreiche Trainingsdaten ermöglichen, indem große Sprachmodelle akustische Signale analysieren. Sollten sich LLMs auch für die Interpretation akustischer Bewegungsdaten eignen, könnten sie künftig als flexible Schnittstelle für natürliche Bewegungen in immersiven Umgebungen dienen.

Weiterlesen nach der Anzeige

Moderne VR-Brillen wie die Meta Quest 3 erfassen Bewegungen der Hände oder VR-Controller in Echtzeit über im Headset verbaute Kameras. Eine KI-gestützte Software analysiert diese, um sie zu interpretieren und exakt im Raum zu verorten. Während das Tracking von VR-Controllern bei guten Lichtverhältnissen nahezu latenzfrei möglich ist, gibt es beim deutlich aufwendigeren kamerabasierten Handtracking nach wie vor Ungenauigkeiten.

Geräte in höheren Preisregionen wie Apples Vision Pro oder Samsungs Galaxy XR nutzen deshalb ergänzend zur Kamera Eye-Tracking. Damit können die Geräte präzise berechnen, wohin Nutzer blicken, während sie eine Eingabe tätigen. Auch hier sind die Interaktionen nicht immer perfekt, wenngleich spürbar geschmeidiger als bei herkömmlichem Handtracking. Eines haben jedoch sämtliche Tracking-Lösungen gemeinsam: Sie erfordern kostspielige Hardware, viel technisches Know-how und Unmengen an Trainingsdaten.

Statt die sichtbaren Bewegungen per Kamera zu erfassen und auszuwerten, möchten die Forschenden aus Hongkong eine günstigere und effizientere Methode etablieren: die Messung von Schallwellen im Ultraschallbereich. Während eines ersten Experiments setzte das Team ein Smartphone ein, das kontinuierlich hochfrequente Signale aussendet und empfängt, die durch Hand- oder Controllerbewegungen reflektiert und verändert werden. Diese Veränderungen werden als sogenannte Channel Impulse Responses (CIR) gemessen und anschließend in dCIR-Bilder umgewandelt, die die zeitlichen Unterschiede im Schallmuster darstellen.

heise online XR-Briefing abonnieren

Jeden zweiten Montag, liefern wir Ihnen die wichtigsten Entwicklungen der XR-Branche. Damit Sie alles im Blick behalten.

E-Mail-Adresse

Ausführliche Informationen zum Versandverfahren und zu Ihren Widerrufsmöglichkeiten erhalten Sie in unserer Datenschutzerklärung.

Um diese Bilder zu interpretieren, kommen multimodale Sprachmodelle zum Einsatz, die neben Text auch visuelle Eingaben verarbeiten können. Das Forschungsteam definierte 15 unterschiedliche Gesten, darunter Zahlen, Buchstaben und einfache Formen. Zehn Testpersonen führten jede Geste mit einem VR-Controller jeweils zehnmal aus. Die daraus entstandenen 1500 dCIR-Bilder wurden zur Klassifikation genutzt. Das System vergleicht dabei ein neues Bild mit ähnlichen Beispielen aus der Datenbank. Diese Auswahl sowie das zu analysierende Bild werden in einen Prompt eingebettet und dem Sprachmodell übergeben. Anschließend entscheidet das Modell, welche Geste am wahrscheinlichsten ist, und liefert eine Begründung für die Wahl.

Weiterlesen nach der Anzeige

Laut den Forschenden zeigen die Ergebnisse eine besonders hohe Erkennungsrate bei klar strukturierten Gesten wie Ziffern oder geometrischen Formen. Hier erreichten die Sprachmodelle Werte von über 90 Prozent. Komplexere Buchstaben mit mehreren Kurven führten hingegen häufiger zu Verwechslungen. Das zuverlässigste Modell für Zahlen war OpenAIs GPT-5. Bei Buchstaben und Formen hatte Anthropics Claude 4 die Nase vorn. Gemini 2.5 Pro lag in sämtlichen Bereichen auf dem dritten Platz. Im Vergleich zu klassischen Verfahren für Klassifikationsaufgaben wie k-Nearest-Neighbor oder Support-Vector-Machines lagen die Sprachmodelle noch leicht zurück, benötigten dafür aber deutlich weniger Trainingsdaten. Zudem liefern sie im Gegensatz zu den herkömmlichen Modellen eine schriftliche Begründung für ihre Entscheidung, was die Ergebnisse nachvollziehbarer macht und bei der Weiterentwicklung der Systeme hilfreich sein soll.

Bisher beweisen die Forschenden nur, dass ihr System grundlegend funktioniert. In der Praxis müsste es allerdings nahezu latenzfrei arbeiten. Zudem bleibt die Frage offen, wie es überhaupt in einem fertigen Produkt umgesetzt werden könnte. Google scheiterte bereits mit dem Konzept Gestensteuerung durch Schallwellen – damals allerdings noch ohne den Einsatz von LLMs. Der 2015 vorgestellte Chip „Project Soli“ sonderte elektromagnetische Wellen ab und erkannte Abweichungen in deren Wellenmuster submillimetergenau. Soli kam schließlich als „Motion Sense“ im Smartphone Pixel 4 zum Einsatz und sollte dort die Steuerung des Smartphones per Fingerbewegungen aus der Ferne ermöglichen. Als Gestensteuerung funktionierte Soli allerdings nicht zuverlässig genug und wurde später als Messgerät für Atem- und Körperbewegungen während des Schlafes in der Smart-Home-Zentrale Nest Hub 2 verbaut.


(joe)



Source link

Künstliche Intelligenz

OpenAI und Gates Foundation: KI für den afrikanischen Gesundheitssektor


Die Gates Foundation und OpenAI gehen eine Partnerschaft ein, um den Zugang zu medizinischer Versorgung in afrikanischen Ländern mittels KI zu verbessern. Das geht aus Blogbeiträgen auf der Website von Bill Gates und OpenAI hervor. Im Rahmen des Projekts Horizon 1000 sollen gemeinsam 50 Millionen US-Dollar an Finanzmitteln, Technologie und technischem Support bereitgestellt werden.

Weiterlesen nach der Anzeige

KI könne insbesondere in ärmeren Ländern eine entscheidende Rolle dabei spielen, den Zugang zu einer qualitativ hochwertigen Versorgung zu gewährleisten, erklärte Microsoft-Co-Gründer und Vorsitzender der Stiftung Bill Gates in einem Blogbeitrag zum Start der Initiative. Ziel von Horizon 1000 sei deshalb die Unterstützung mehrerer afrikanischer Länder bei der Integration von Künstlicher Intelligenz in die Systeme des Gesundheitssektors.

Gates zufolge soll der Einsatz von KI vor allem die gravierenden Mängel an medizinischem Fachpersonal in afrikanischen Ländern abfedern, aber auch die Gesundheitsinfrastruktur insgesamt verbessern. Allein im Bereich südlich der Sahara mangelt es an rund 5,6 Millionen Beschäftigten im Gesundheitswesen. Das schreibt der US-Konzern OpenAI zum Start von Horizon 1000 auf seiner Website. In der Praxis sollen KI-Anwendungen vor allem helfen, den Verwaltungsaufwand zu reduzieren und dem medizinischen Personal mehr Zeit für die Patientenversorgung zu ermöglichen.

Laut Gates wird Ruanda als erstes Land Unterstützung im Rahmen von Horizon 1000 erhalten. In Ruanda komme derzeit nur eine medizinische Fachkraft auf 1000 Einwohner, was weit unter der Empfehlung von etwa vier Fachkräften liege, schreibt der Vorsitzende der Gates Foundation auf seinem Blog. Der ruandische Gesundheitsminister Dr. Sabin Nsanzimana habe deshalb ein KI-gestütztes Gesundheitszentrum für die Hauptstadt Kigali angekündigt, mittels dessen die begrenzten Ressourcen so effizient wie möglich verteilt werden sollen.

Derartige Projekte sollen im Rahmen von Horizon 1000 zukünftig unterstützt werden. Konkret geht es Gates zufolge vor allem um die Einführung von KI-Systemen in medizinische Einrichtungen wie Krankenhäusern und Arztpraxen, aber auch in Gemeinden und Privathaushalten. KI-Tools sollen medizinisches Personal jedoch nur unterstützen und nicht ersetzen, betonte der US-Multimilliardär.

Dennoch habe KI das Potenzial, das internationale Gesundheitswesen nach den massiven Kürzungen der internationalen Entwicklungshilfe im vergangenen Jahr wieder auf Kurs zu bringen. Das erklärte Gates der Nachrichtenagentur Reuters am Rande des Weltwirtschaftsforums in Davos. „Mithilfe von Innovationen und KI können wir wieder auf den richtigen Weg kommen“, sagte er am Mittwoch in Davos. Die Technologie werde das Gesundheitswesen revolutionieren und sei insbesondere für die von den Kürzungen betroffenen Länder wertvoll.

Weiterlesen nach der Anzeige

Große KI-Konzerne drängen vermehrt in den Gesundheitssektor vor. Nachdem OpenAI mit ChatGPT Health bereits einen KI-Gesundheitsassistenten eingeführt hatte, zog auch das US-Unternehmen Anthropic nach und veröffentlichte mit Claude for Healthcare einen eigenen KI-gestützten Gesundheitsassistenten.

Für die KI-Branche verspricht der Gesundheitssektor, lukrativ zu sein. Kritiker warnen allerdings vor möglichen Folgen des Einsatzes von KI im Gesundheitswesen. Systeme wie ChatGPT seien nicht als Medizinprodukte zugelassen und dürften daher nicht zur Behandlungsunterstützung eingesetzt werden, erklärte Jürgen Schröder, Leiter des Bereichs Vertragsarztrecht bei der Kassenärztlichen Bundesvereinigung (KBV).

Außerdem verweisen Experten wie Manuel Hofmann von der Deutschen Aidshilfe auf die Diskrepanz zwischen Zukunftsfantasien und den herrschenden Realitäten von Gesundheitssystemen. Dass administrative Aufgaben wegfallen und mehr Zeit für die persönliche Betreuung bleibe, sei in Gesundheitssystemen, die auf veraltete Technik wie Faxgeräte angewiesen seien, eine Illusion. Am Beispiel der Krankheit HIV und angesichts des Rückzugs der USA aus internationalen HIV-Programmen zeige sich vor allem, woran es wirklich mangelt. Menschen würden an einer gut behandelbaren Krankheit sterben, weil ihnen die Medikamente fehlen, betonte Hofmann.


(rah)



Source link

Weiterlesen

Künstliche Intelligenz

Ubisoft-Aktie verliert über 30 Prozent an Wert


Ubisofts großer Reset führt zu einem massiven Kursrutsch an den Börsen: Seit der Ankündigung vom Mittwochabend, das Unternehmen neu ausrichten zu wollen, hat die Aktie des französischen Spieleunternehmens über 30 Prozent an Wert verloren. Aktuell ist eine Ubisoft-Aktie keine 4,40 Euro mehr wert – verglichen mit 11 Euro vor nur einem Jahr.

Weiterlesen nach der Anzeige

Ein Blick in die etwas weitere Vergangenheit zeigt das Ausmaß des Kursrutsches: Wer zum Marktstart der Playstation 5 und Xbox Series X/S im Herbst 2020 Ubisoft-Aktien gekauft und bis heute gehalten hat, kommt mittlerweile auf ein Minus von 95 Prozent, rechnet das Branchenmagazin Gameswirtschaft.de vor. Der Börsenwert von Ubisoft liegt mittlerweile unter 600 Millionen Euro.

Anleger reagieren verunsichert auf Ubisofts neue Unternehmensstrategie, die das Unternehmen langfristig aus der Dauerkrise führen soll. Im Zentrum der neuen Organisation stehen fünf „Kreativhäuser“, die Marken und Spielkonzepte klar aufteilen. Damit gehen Kostensparmaßnahmen einher: In den kommenden zwei Jahren will Ubisoft 200 Millionen Euro einsparen – zusätzlich zu 300 Millionen Euro, die Ubisoft eigenen Angaben zufolge bereits in den vergangenen Jahren eingespart hat. Zudem wurde die Entwicklung von insgesamt sechs Spielen eingestellt und die Prognose für das Geschäftsjahr nach unten korrigiert.

Ubisoft-Chef und -Gründer Yves Guillemot spricht in einer Mitteilung (PDF) von einem „großen Reset“ und einem „entscheidenden Wendepunkt“ für das Unternehmen. Man müsse sich aber auf harte Jahre einstellen, bis man zurück in die Erfolgsspur komme. „Die Neuausrichtung des Portfolios wird erhebliche Auswirkungen auf die kurzfristige finanzielle Entwicklung der Gruppe haben, insbesondere in den Geschäftsjahren 2026 und 2027.“

Ubisoft steckt seit Jahren in der Krise – unter anderem, weil teure Großproduktionen wie „Star Wars Outlaws“ und „Skull and Bones“ nicht den erhofften Erfolg eingebracht haben. Im vergangenen November überraschte die französische Spielefirma ihre Anleger, indem sie die Bekanntgabe der Quartalszahlen kurzfristig verschob. Der Handel mit Ubisoft-Aktien wurde infolgedessen zwischenzeitlich ausgesetzt.


(dahe)



Source link

Weiterlesen

Künstliche Intelligenz

DocuSeal 2.3.0: Open-Source-Alternative zu DocuSign mit KI-Features


DocuSeal hat Version 2.3.0 seines Open-Source-Tools für elektronische Unterschriften veröffentlicht. Das Update bringt vor allem Verbesserungen für den Formular-Editor sowie eine wichtige Sicherheitsänderung für Docker-Installationen.

Weiterlesen nach der Anzeige

Hauptneuerung ist eine KI-gestützte Felderkennung, die Formularfelder in PDF-Dokumenten automatisch identifiziert. Nutzer können die Funktion über das neue Kontextmenü aufrufen, per Rechtsklick auf Felder. Damit lassen sich Formulare schneller für elektronische Signaturen vorbereiten. Das Kontextmenü umfasst darüber hinaus Funktionen zum Konfigurieren, Kopieren und Einfügen von Feldern.

Ein weiteres Feature ist der neue Select-Modus, den Anwender über die Tab-Taste oder das Kontextmenü aktivieren können. Im Select-Modus lassen sich mehrere Felder gleichzeitig auswählen und gemeinsam verschieben, skalieren oder konfigurieren. Die Mehrfachauswahl funktioniert wie gewohnt über Strg+Klick.

Für Docker-Nutzer bringt Version 2.3.0 eine wichtige Sicherheitsverbesserung: Die Docker-App läuft nun mit der Rolle docuseal:docuseal statt mit Root-Rechten. Dies erhöht die Sicherheit bei Standard-Docker-Compose-Installationen, bei denen Speicher und Umgebungsvariablen auf dem Host-System liegen. Nutzer mit alternativen Installationen, die Umgebungsvariablen anders einbinden oder S3-Speicher verwenden, sind von dieser Änderung nicht betroffen.

DocuSeal bezeichnet sich als selbst gehostete Alternative zu proprietären Diensten wie DocuSign. Die Software steht unter AGPL-3.0-Lizenz und lässt sich auf eigenen Servern oder in der Cloud betreiben.

Weiterlesen nach der Anzeige

Die Plattform bietet einen WYSIWYG-PDF-Formular-Editor mit zwölf Feldtypen, darunter Signatur-, Datums-, Datei- und Checkbox-Felder. Mehrere Unterzeichner können gleichzeitig an einem Dokument arbeiten. Die Software versendet automatisierte E-Mails über SMTP und speichert Daten wahlweise lokal, auf AWS S3, Google Cloud Storage oder Microsoft Azure. Die elektronischen Signaturen sind nach PDF-Standard verifizierbar.

Zusätzlich zur kostenlosen Version bietet DocuSeal Pro-Features wie White-Labeling, Nutzerrollen, Erinnerungen, SMS-Verifikation, bedingte Felder, Massen-Versand über CSV oder XLSX sowie Single Sign-on per SAML. Die Plattform ist SOC-2- und ISO-27001-zertifiziert.

DocuSeal lässt sich per Docker mit wenigen Befehlen installieren und nutzt standardmäßig SQLite als Datenbank. Optional unterstützt die Software PostgreSQL und MySQL. Weitere Informationen finden sich auf der GitHub-Seite des Projekts.


(fo)



Source link

Weiterlesen

Beliebt