Künstliche Intelligenz
Studie: ChatGPT analysiert Ultraschallsignale für effizienteres Tracking in VR
Ein Forschungsteam der Hong Kong Baptist University hat ein neues Verfahren zur Gestenerkennung in Virtual-Reality-Umgebungen vorgestellt. Die Methode soll Bewegungen ohne Trackingkamera, spezielle Sensoren oder umfangreiche Trainingsdaten ermöglichen, indem große Sprachmodelle akustische Signale analysieren. Sollten sich LLMs auch für die Interpretation akustischer Bewegungsdaten eignen, könnten sie künftig als flexible Schnittstelle für natürliche Bewegungen in immersiven Umgebungen dienen.
Weiterlesen nach der Anzeige
Ultraschalltracking mit Smartphone und LLM
Moderne VR-Brillen wie die Meta Quest 3 erfassen Bewegungen der Hände oder VR-Controller in Echtzeit über im Headset verbaute Kameras. Eine KI-gestützte Software analysiert diese, um sie zu interpretieren und exakt im Raum zu verorten. Während das Tracking von VR-Controllern bei guten Lichtverhältnissen nahezu latenzfrei möglich ist, gibt es beim deutlich aufwendigeren kamerabasierten Handtracking nach wie vor Ungenauigkeiten.
Geräte in höheren Preisregionen wie Apples Vision Pro oder Samsungs Galaxy XR nutzen deshalb ergänzend zur Kamera Eye-Tracking. Damit können die Geräte präzise berechnen, wohin Nutzer blicken, während sie eine Eingabe tätigen. Auch hier sind die Interaktionen nicht immer perfekt, wenngleich spürbar geschmeidiger als bei herkömmlichem Handtracking. Eines haben jedoch sämtliche Tracking-Lösungen gemeinsam: Sie erfordern kostspielige Hardware, viel technisches Know-how und Unmengen an Trainingsdaten.
Statt die sichtbaren Bewegungen per Kamera zu erfassen und auszuwerten, möchten die Forschenden aus Hongkong eine günstigere und effizientere Methode etablieren: die Messung von Schallwellen im Ultraschallbereich. Während eines ersten Experiments setzte das Team ein Smartphone ein, das kontinuierlich hochfrequente Signale aussendet und empfängt, die durch Hand- oder Controllerbewegungen reflektiert und verändert werden. Diese Veränderungen werden als sogenannte Channel Impulse Responses (CIR) gemessen und anschließend in dCIR-Bilder umgewandelt, die die zeitlichen Unterschiede im Schallmuster darstellen.
heise online XR-Briefing abonnieren
Jeden zweiten Montag, liefern wir Ihnen die wichtigsten Entwicklungen der XR-Branche. Damit Sie alles im Blick behalten.
E-Mail-Adresse
Ausführliche Informationen zum Versandverfahren und zu Ihren Widerrufsmöglichkeiten erhalten Sie in unserer Datenschutzerklärung.
Um diese Bilder zu interpretieren, kommen multimodale Sprachmodelle zum Einsatz, die neben Text auch visuelle Eingaben verarbeiten können. Das Forschungsteam definierte 15 unterschiedliche Gesten, darunter Zahlen, Buchstaben und einfache Formen. Zehn Testpersonen führten jede Geste mit einem VR-Controller jeweils zehnmal aus. Die daraus entstandenen 1500 dCIR-Bilder wurden zur Klassifikation genutzt. Das System vergleicht dabei ein neues Bild mit ähnlichen Beispielen aus der Datenbank. Diese Auswahl sowie das zu analysierende Bild werden in einen Prompt eingebettet und dem Sprachmodell übergeben. Anschließend entscheidet das Modell, welche Geste am wahrscheinlichsten ist, und liefert eine Begründung für die Wahl.
Je klarer die Geste, desto eindeutiger das Ergebnis
Weiterlesen nach der Anzeige
Laut den Forschenden zeigen die Ergebnisse eine besonders hohe Erkennungsrate bei klar strukturierten Gesten wie Ziffern oder geometrischen Formen. Hier erreichten die Sprachmodelle Werte von über 90 Prozent. Komplexere Buchstaben mit mehreren Kurven führten hingegen häufiger zu Verwechslungen. Das zuverlässigste Modell für Zahlen war OpenAIs GPT-5. Bei Buchstaben und Formen hatte Anthropics Claude 4 die Nase vorn. Gemini 2.5 Pro lag in sämtlichen Bereichen auf dem dritten Platz. Im Vergleich zu klassischen Verfahren für Klassifikationsaufgaben wie k-Nearest-Neighbor oder Support-Vector-Machines lagen die Sprachmodelle noch leicht zurück, benötigten dafür aber deutlich weniger Trainingsdaten. Zudem liefern sie im Gegensatz zu den herkömmlichen Modellen eine schriftliche Begründung für ihre Entscheidung, was die Ergebnisse nachvollziehbarer macht und bei der Weiterentwicklung der Systeme hilfreich sein soll.
Bisher beweisen die Forschenden nur, dass ihr System grundlegend funktioniert. In der Praxis müsste es allerdings nahezu latenzfrei arbeiten. Zudem bleibt die Frage offen, wie es überhaupt in einem fertigen Produkt umgesetzt werden könnte. Google scheiterte bereits mit dem Konzept Gestensteuerung durch Schallwellen – damals allerdings noch ohne den Einsatz von LLMs. Der 2015 vorgestellte Chip „Project Soli“ sonderte elektromagnetische Wellen ab und erkannte Abweichungen in deren Wellenmuster submillimetergenau. Soli kam schließlich als „Motion Sense“ im Smartphone Pixel 4 zum Einsatz und sollte dort die Steuerung des Smartphones per Fingerbewegungen aus der Ferne ermöglichen. Als Gestensteuerung funktionierte Soli allerdings nicht zuverlässig genug und wurde später als Messgerät für Atem- und Körperbewegungen während des Schlafes in der Smart-Home-Zentrale Nest Hub 2 verbaut.
(joe)
Künstliche Intelligenz
Studie: Rechenzentren rund um Frankfurt kurbeln Wirtschaft an
Frankfurt und das umliegende Rhein-Main-Gebiet haben sich zu einem der wichtigsten digitalen Hubs Europas entwickelt. Eine neue Studie des Instituts der deutschen Wirtschaft (IW Consult) und des Beratungshauses Detecon für den eco-Verband der deutschen Internetwirtschaft unterstreicht die enorme ökonomische Bedeutung der dort ansässigen Rechenzentrumsbranche. Im Gegensatz zur Gesamtwirtschaft, die in Frankfurt und der Region Rhein-Main in den vergangenen fünf Jahren um rund 16 Prozent wuchs, verdoppelte sich dort gleichzeitig das Bruttoinlandsprodukt (BIP) im Sektor der Betreiber von Rechenzentren.
Weiterlesen nach der Anzeige
Die Prognosen sehen laut der Analyse ein ungebremstes Wachstum voraus, schreibt der eco: Das Branchen-BIP soll in den kommenden fünf Jahren in der hessischen Gegend voraussichtlich um weitere 175 Prozent steigen.
Die Wertschöpfung beschränke sich dabei nicht nur auf die Betreiber selbst, heißt es: Jeder in Rechenzentren erwirtschaftete Euro soll weitere 51 Cent an wirtschaftlicher Leistung anstoßen – 24 Cent davon direkt in der Region. Zudem generierte die Branche 2023 ein Steueraufkommen von 405 Millionen Euro. Davon sollen 287 Millionen Euro direkt auf die Betreiber und weitere 117 Millionen Euro auf Zulieferer entfallen sein. Geschätzt blieben etwa zehn Prozent des Steueraufkommens in den Standortkommunen, größtenteils aufgrund von Gewerbesteuern.
Noch bedeutender sind die „Spillover-Effekte“ für Anwenderindustrien: Unternehmen, die Rechenzentrumsinfrastruktur nutzen, sind laut der IW-Studie wesentlich innovativer. Sie konnten rund 18 Prozent ihrer Umsätze mit neuen Produkten oder Dienstleistungen erzielen, während Unternehmen ohne die Inanspruchnahme von Rechenzentren nur knapp 8 Prozent erreichten. Dieser Effekt wird durch den gegenwärtigen KI-Hype verstärkt, da entsprechende Anwendungen einen massiven Bedarf an Rechenleistung und schnellen Netzen haben.
Diese Sogwirkung wird auch durch den in Frankfurt angesiedelten De-Cix verdeutlicht, den weltweit größten Internetknoten. Die dort herrschende Infrastrukturdichte zieht heimische wie internationale Unternehmen an, die jährlich mindestens zwei Milliarden Euro in die digitale Infrastruktur der Mainmetropole investieren.
Regionale Risiken: Der Kampf um den Strom
Trotz der hervorstechenden Wachstumszahlen stehen Betreiber in Frankfurt und ganz Deutschland zunehmend vor großen Herausforderungen. Die IW-Studie benennt die kritischen Standortfaktoren: hohe Energiekosten, lange Genehmigungsverfahren, regulatorische Unsicherheit und Flächenknappheit.
Ein akutes Problem ist dabei die Stromversorgung. Hier droht der digitale Boom, die Netze der Region an ihre Grenzen zu bringen, wie jüngst auch eine Analyse von AlgorithmWatch ergab. Der rapide steigende Energiehunger – insbesondere durch den Einsatz von KI – führt laut Branchenbeobachtern zu Engpässen bei der Energieversorgung und gefährdet die Netzstabilität. Ein modernes Rechenzentrum kann so viel Strom verbrauchen wie eine Großstadt. Künftige, rein KI-getriebene Rechenzentren dürften einen noch deutlich höheren Bedarf haben.
Weiterlesen nach der Anzeige
Diese Entwicklung birgt das Risiko, dass die dringend benötigten kurzfristig verfügbaren zusätzlichen Stromkapazitäten in großem Maßstab in der Region nicht mehr gewährleistet werden können. Dies verschlechtert die Rahmenbedingungen für die Betreiber massiv.
Skandinavien lockt mal wieder
Béla Waldhauser, Sprecher der unter dem Dach des eco gegründeten Allianz zur Stärkung digitaler Infrastrukturen, warnt daher eindringlich vor einer Abwanderung in andere europäische Länder. Er schielt dabei etwa auf Skandinavien, wo attraktivere Konditionen in Form günstigerer Energiepreise und eines einfacheren sowie leistungsfähigeren Netzzugangs herrschten.
Waldhausers Forderung an Politik und Kommunen: Es braucht ein eindeutiges politisches Engagement für die digitale Infrastruktur. Bezahlbarer Strom müsste sichergestellt sowie beschleunigte und verlässliche Genehmigungsverfahren eingeführt werden, um Frankfurt und die gesamte Region als digitales Zentrum langfristig zu bewahren. Dieses Standbein der digitalen Wirtschaft dürfe nicht gekappt werden.
(nie)
Künstliche Intelligenz
Studie: Bundesverwaltung soll bei generativer KI auf Eigenentwicklungen setzen
Die dynamische Entwicklung generativer Künstlicher Intelligenz (KI), die vor allem die großen Sprachmodelle (LLMs) hinter ChatGPT, Gemini oder Claude verdeutlichen, stellt Staaten und Verwaltungen weltweit vor eine wichtige strategische Frage: Wie lassen sich solche Instrumente zur Textgenerierung, Wissenserschließung und Prozessunterstützung gezielt verwenden, ohne dabei die digitale Souveränität zu opfern?
Weiterlesen nach der Anzeige
Leistungsfähige moderne LLMs benötigen riesige Datenmengen, teure Hardware und viel Energie – Ressourcen, die heute primär von wenigen, zumeist außereuropäischen Tech-Giganten kontrolliert werden. Für den Staat ist es deshalb laut Experten entscheidend, sich Handlungsfähigkeit, Transparenz und Kontrolle über diese Schlüsseltechnologie zu verschaffen.
Das Kompetenzzentrum Öffentliche IT (Öfit) am Fraunhofer-Institut Fokus hat in einer jetzt veröffentlichten, vom Bundesinnenministerium geförderten Studie die LLM-basierten Systeme der Bundesverwaltung daraufhin untersucht, wie unabhängig sie aufgestellt sind. Digitale Souveränität bedeutet demnach, dass Deutschland zusammen mit Europa zentrale digitale Infrastrukturen, Daten und Rechnerinfrastrukturen eigenständig, sicher und nach individuellen Regeln gestalten und betreiben kann.
Die Analyse der LLM-Projekte erfolgte entlang von drei strategischen Zielen, die sich aus der Digitalpolitik des Bundes ableiten lassen: die Wechselmöglichkeit, also die faktische Verfügbarkeit alternativer Lösungen und die Austauschbarkeit von Systemkomponenten. Die Forscher blickten ferner auf die Gestaltungsfähigkeit, die etwa die eigenen technischen und organisatorischen Kompetenzen zur Bewertung, zum Betrieb und zur Weiterentwicklung von Systemen umfasst. Zudem fokussierten sie sich auf den Einfluss auf Anbieter, der durch Markt- und Verhandlungsmacht, etwa bei der Beschaffung, gewährleistet wird.
Eigenentwicklungen reduzieren Abhängigkeit
Die gute Nachricht der Studie lautet: Im Bereich der LLMs konnte im Gegensatz zu früher festgestellten „Schmerzpunkten“ bei Bürosoftware oder Datenbankprodukten keine kritische singuläre Abhängigkeit von einem einzelnen Großkonzern festgestellt werden. Die Bundesverwaltung hat es demnach geschafft, für viele typische Anwendungsfälle LLM-basierter Systeme Eigenentwicklungen aufzubauen. Dadurch muss für einen Großteil der alltäglichen Aufgaben nicht zwingend auf die Produkte großer, oft nicht-europäischer Konzerne zurückgegriffen werden. Das mindert das Risiko von vornherein, in neue Interdependenzen gegenüber Dritten zu geraten.
Die Risiken für die staatliche Handlungsfähigkeit sind den Wissenschaftlern zufolge aus heutiger Sicht überschaubar, da die entwickelten Lösungen derzeit ausschließlich der Arbeitsunterstützung für Verwaltungsmitarbeitende dienen. Ein Ausfall würde die staatliche Handlungsfähigkeit nicht unmittelbar gefährden. Technisch gesehen trägt zur Souveränität bei, dass die LLMs meist auf eigener Hardware laufen und bei Bedarf mit geringem bis mittlerem Aufwand ausgetauscht werden können.
Open Source als europäische Chance
Weiterlesen nach der Anzeige
Auf der Ebene der Sprachmodelle selbst setzt die Bundesverwaltung mehrheitlich auf nicht-europäische Open-Source-Modelle, die in verwaltungsinterner Infrastruktur betrieben werden. Das stärkt laut der Untersuchung zwar die Wechselmöglichkeit, da die LLMs auf eigener Infrastruktur gehostet und bei Bedarf ersetzt werden können. Es verbleibe jedoch eine strategische Lücke: Angesichts des sich wandelnden Open-Source-Verständnisses im KI-Kontext empfehlen die Autoren dringend zu prüfen, ob die Entwicklung eines eigenen, offen bereitgestellten europäischen LLMs anzustreben sei. Ziel müsse es sein, eine dauerhafte Unabhängigkeit von marktbeherrschenden LLM-Anbietern zu erreichen und die Modelle auf einer eigenständigen europäischen Werte- und Normenbasis zu verankern.
Einschlägige LLM-Projekte bei Behörden sehen sich zudem mit Hürden konfrontiert, die weiteres Wachstum und Nachnutzbarkeit behindern. Dazu gehören laut der Studie als zu kompliziert wahrgenommene rechtliche KI-Vorschriften, die Entwicklungen verzögern und umfassende juristische Kompetenzen in den Ämtern erfordern. Diese Unsicherheiten und die teils als gering eingestufte rechtliche Kompetenz schränkten die Veröffentlichung der Entwicklungen als Open Source ein, heißt es. Ferner äußerten befragte Projektverantwortliche mehrfach den Wunsch nach einer KI-spezifischen Cloud-Infrastruktur, die mit entsprechend geschultem Personal ausgestattet ist, um den Betrieb zu vereinfachen.
Die Studie enthält diverse Handlungsempfehlungen, um die digitale Souveränität nachhaltig zu sichern. Dazu zählen der Ausbau gemeinsamer LLM-Infrastrukturen über Ressortgrenzen hinweg und die Stärkung von Open-Source-Ansätzen. Zudem sollen einheitliche rechtliche Leitplanken etabliert werden etwa durch einen verpflichtenden „Souveränitätscheck“ für kritische LLM-Projekte. Die Beschaffung sei über föderale Ebenen hinweg zu bündeln um Kriterien zur digitalen Souveränität durchzusetzen und die Verhandlungsmacht gegenüber großen Anbietern zu stärken. Bundesdigitalminister Karsten Wildberger (CDU) wertet die Ergebnisse als Bestätigung, „dass wir bereits auf dem richtigen Weg sind, ein solides Fundament für unabhängige KI‑Lösungen in der Bundesverwaltung“ zu schaffen.
Lesen Sie auch
(nie)
Künstliche Intelligenz
Radioaktives Radon: Warum es ein unterschätztes Risiko ist
Auf der Maker Faire 2024 sprach mich Make-Chefredakteur Daniel Bachfeld über einen Ergänzungsartikel zum Taupunktlüfter an. Dieser sollte beschreiben, wie man dem Edelgas Radon auf die Spur kommt und wie ein Taupunktlüfter es aus dem Haus entfernen kann. Aus dieser einfachen Frage ist eines meiner umfangreichsten Projekte entstanden, für das ich auch Informationen bei Fachfirmen, Universitäten und dem Bundesamt für Strahlenschutz einholen musste. Und, ohne zu übertreiben: Es geht bei diesem Thema um Leben und Tod!
Meine Erkenntnisse sind in einem weiteren Artikel aufsplittet.
- Was ist Radon?
- Welche Gefahr geht davon aus?
- Wie können wir es mit Maker-Mitteln detektieren?
Checkliste
Zeitaufwand:
4 Stunden (Ballonexperiment)
Kosten:
etwa 60 Euro (Geigerzähler für Ballonexperiment)
Material
Werkzeug
- Geigerzähler etwa Bosean FS-5000 (50 Euro)
Radon
Bei Radon handelt es sich um ein radioaktives Edelgas, das in der Erdkruste natürlicherweise vorkommt. Es entsteht durch den Zerfall von Uran und Thorium, die in sehr vielen Gesteinen und Böden vorkommen. Radon selbst ist farb-, geruchs- und geschmackslos, was bedeutet, dass es weder mit bloßem Auge noch mit anderen Sinnen wahrgenommen werden kann. Zudem ist es schwerer als Luft, was später noch eine wichtige Rolle spielen wird.
Das war die Leseprobe unseres heise-Plus-Artikels „Radioaktives Radon: Warum es ein unterschätztes Risiko ist“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.
-
UX/UI & Webdesignvor 2 MonatenIllustrierte Reise nach New York City › PAGE online
-
Datenschutz & Sicherheitvor 3 MonatenJetzt patchen! Erneut Attacken auf SonicWall-Firewalls beobachtet
-
Künstliche Intelligenzvor 2 MonatenAus Softwarefehlern lernen – Teil 3: Eine Marssonde gerät außer Kontrolle
-
Künstliche Intelligenzvor 2 Monaten
Top 10: Die beste kabellose Überwachungskamera im Test
-
UX/UI & Webdesignvor 3 MonatenFake It Untlil You Make It? Trifft diese Kampagne den Nerv der Zeit? › PAGE online
-
Entwicklung & Codevor 3 WochenKommandozeile adé: Praktische, grafische Git-Verwaltung für den Mac
-
UX/UI & Webdesignvor 2 MonatenSK Rapid Wien erneuert visuelle Identität
-
Social Mediavor 3 MonatenSchluss mit FOMO im Social Media Marketing – Welche Trends und Features sind für Social Media Manager*innen wirklich relevant?
