Connect with us

Künstliche Intelligenz

Laion: KI soll die Angst in der Stimme erkennen können


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

EmoNet ist eine Open-Source-Suite, die KI-Systemen helfen soll, emotionale Signale in Stimme und Mimik der Menschen zu erkennen. Sie wurde von Laion und Intel gemeinsam entwickelt und steht frei zur Verfügung. Zur Suite gehören Modelle, Datensätze sowie Benchmarks.

Laion ist dafür bekannt, den Datensatz bereitzustellen, auf dessen Basis auch der Bildgenerator Stable Diffusion trainiert wurde. Es ist eine Open-Source-Initiative aus Hamburg. In einem Blogbeitrag schreibt Laion: „Ein spannendes Gebiet der heutigen Technologie ist das Streben nach künstlicher Intelligenz, die den Menschen wirklich versteht und auf einer tieferen Ebene mit ihm interagiert.“ Zwar habe es enorme Fortschritte bei etwa der Sprachverarbeitung gegeben, eine „entscheidende Dimension“ sei jedoch noch nicht verwirklicht: „echte emotionale Intelligenz“.

Dafür solle KI künftig offenbar „das leise Zittern der Angst in einer Stimme“ erkennen können. Bei Laion glaubt man, dass dies nicht nur ein „faszinierendes akademisches Unterfangen“ sei, „sondern eine grundlegende Notwendigkeit für die Zukunft der Zusammenarbeit zwischen Mensch und KI“. Man hat es dabei sowohl auf die Stimme als auch den Gesichtsausdruck abgesehen.

Mit EmoNet-Face bietet Laion einen Benchmark samt Datenbank mit mehr als 200.000 synthetischen Bildern von Gesichtern – unterschiedlicher Herkunft und Demografie. EmoNet-Voice ist ein Benchmark für die Erkennung von Sprachemotionen. Dazu gehören 4692 Audiobeispiele synthetischer Stimmen. 40 Kategorien für Emotionen gibt es. Zu den Emotionen gehören kognitive Zustände wie Konzentration, Verwirrung, Zweifel, physische Zustände wie Schmerzen, Müdigkeit und Intoxikation sowie soziale Emotionen wie Scham und Stolz.


Die Taxonomie der Emotionen.

Die Taxonomie der Emotionen.

Die Taxonomie der Emotionen.

(Bild: Screenshot Laion)

Ein Video mit einem Standbild zeigt, wie Satz für Satz von einer Stimme gesprochen wird, und darunter festgehalten steht, um welche Emotion es sich dabei handelt. Beispielsweise sagt die Stimme, sie gehe zu einem Filmfestival. Darunter steht etwa, es sei enthusiastisch, interessiert und optimistisch.

Aufbauend auf den eigenen Datensets hat Laion auch ein eigenes KI-Modell entwickelt, das Emotionen aus Gesichtern sowie eines, das Emotionen aus Stimmen erkennen kann: Empathic Insight-Face Model und Empathic Insight-Voice Model.

Modelle, die Emotionen erkennen können, sind nicht per se verboten. Der AI Act reguliert allerdings gewisse Anwendungen dieser Technologie. Bedarf es der Fähigkeit, ein Lachen zu verstehen, um beispielsweise einen fröhlichen Menschen in einem generierten Bild darzustellen, ist hingegen Emotionserkennung am Arbeitsplatz etwa tabu. Auch hier gibt es Ausnahmen, der Pilot eines Flugzeugs etwa darf daraufhin überwacht werden, ob er müde ist.

Lesen Sie auch

Laion hat im Sinne, mittels Emotionserkennung bessere KI-Assistenten zu erschaffen. „Die Erfassung der Ausdrücke ermöglicht es KI-Assistenten, einfühlsamer, engagierter und unterstützender zu werden; Eigenschaften, die für transformative Anwendungen in den Bereichen Bildung, psychische Gesundheit, Begleitung und darüber hinaus entscheidend sind.“ Außerdem freue sich der Verein auf eine Zukunft, in der jedes Foundation-Model in der Lage ist, so gut im Voice-Acting zu sein wie Robert De Niro und Scarlett Johansson.

Mit Bud-E Whisper legt Laion zudem eine Erweiterung von OpenAIs Transkriptions-KI Whisper vor. Damit wird nicht mehr bloß der reine sprachliche Inhalt transkribiert, sondern auch der emotionale Tonfall niedergeschrieben sowie gegebenenfalls Lachen oder nach Luft schnappen und Informationen zum Sprecher wie Alter, Geschlecht. Um Bud-E Whisper zu entwickeln wurden unter anderem 5000 Stunden aus öffentlichen Vlogs und Online-Tagebüchern sowie Filmdialoge genutzt. Gemini Flash war für die Annotation der Emotionen zuständig.


(emw)



Source link

Weiterlesen
Kommentar schreiben

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Künstliche Intelligenz

Strom im Urlaub: Zehn USB-C-Stromadapter für iPhone, iPad und Mac im Test


Zunächst sollten wir uns mit den Grundlagen beschäftigen, wenn es um Reisenetzteile geht.

In der EU haben wir mittlerweile fast überall gleiche Steckdosen (Typ C und F). Doch kommt man nach England, trifft man bereits auf flache Outlets mit dreieckigen Kontakten (Typ G). In den USA und Japan sind die zwei Kontakte flach und liegen parallel zueinander (A, B), während Australien und China die zwei platten Zungen jeweils um 45 Grad in unterschiedliche Richtung verdrehen (Typ I).

In Hotels gibt es meistens Universalsteckdosen im Badezimmer, um den Rasierapparat betreiben zu können; andernorts – für iPhone, iPad oder MacBook – muss man sich jedoch häufig eines Adapters bedienen. Welche wichtigen Reiseländer welche Steckertypen verwenden, zeigt die Tabelle rechts. Es gibt aber viele Länder auf der Erde, etwa Belgien, die Schweiz, Israel oder das südliche Afrika, in denen noch andere Steckdosen verwendet werden.


Das war die Leseprobe unseres heise-Plus-Artikels „Strom im Urlaub: Zehn USB-C-Stromadapter für iPhone, iPad und Mac im Test“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.



Source link

Weiterlesen

Künstliche Intelligenz

Content Scraping: BBC droht Perplexity mit rechtlichen Schritten


Die British Broadcasting Corporation (BBC), die öffentlich-rechtliche Rundfunkanstalt des Vereinigten Königreichs, hat der KI-Suchmaschine Perplexity mit rechtlichen Schritten gedroht. Perplexity würde, so vermutet es die BBC, die Online-Inhalte des Rundfunks nutzen, um seine KI-Systeme weiterzuentwickeln. Perplexity bestreitet das.

Die Financial Times zitiert aus einem Brief der BBC an Perplexity-Chef Aravind Srinivas, welcher der Zeitung vorliegt. Darin behauptet die BBC, Beweise zu haben, dass Perplexity sein „Standard-KI-Modell“ mit Inhalten der BBC trainiert. Hierfür soll Perplexity demnach Content Scraping betreiben – also automatisiert große Teile von Internetinhalten herunterladen, unabhängig von den Wünschen der Urheber.

Weiter soll Perplexity die BBC-Inhalte, zum Beispiel frisch erschienene Online-Artikel, im genauen Wortlaut in seinen eigenen Textantworten an Perplexity-Nutzer wiedergeben. Zwar tauchen dabei offenbar häufig auch BBC-Links als Quelle auf, doch auch das scheint dem Rundfunkhaus nicht zu gefallen.

In ihrem Brief spricht die BBC demnach von einer möglichen einstweiligen Verfügung gegen Perplexity, wenn das Unternehmen die von der BBC behaupteten Aktivitäten nicht einstellt. Auch die Löschung jeglichen BBC-Materials aus den von Perplexity genutzten KI-Systemen und eine finanzielle Entschädigung für bereits erfolgte Verletzungen des geistigen Eigentums seien für die BBC denkbar.

Perplexity betrachtet die Vorwürfe dagegen als „manipulativ und opportunisitsch“, teilte das Unternehmen der Financial Times mit. Das britische Rundfunkhaus hätte ganz grundsätzlich ein falsches Verständnis „von Technologie, dem Internet und dem Recht auf geistiges Eigentum“. Perplexity sieht eine andere Absicht hinter dem Brief: Die jetzigen Behauptungen würden zeigen, wie weit die BBC bereit zu gehen sei, „um Googles illegales Monopol aus eigenem Interesse zu erhalten“.

Damit spielt Perplexity offenbar auf Vereinbarungen an, die Google weltweit mit zahlreichen Medienhäusern getroffen hat, um diese für die Verwertung ihrer Inhalte in den eigenen Nachrichtenaggregatoren zu vergüten. Doch Google setzt mittlerweile selbst auf KI-Zusammenfassungen à la Perplexity – und hiesige Verleger laufen dagegen Sturm. Denn die Klicks auf den Webseiten der Medienhäuser gehen dadurch massiv zurück.

Perplexity beruft sich zudem darauf, dass das US-Unternehmen ja gar kein eigenes KI-Modell betreibe, sondern seinen Nutzern andere große LLMs wie von Google, OpenAI oder Anthropic zur Verfügung stelle. Das einzige wirklich „eigene“ Modell basiere auf Metas Llama-KI und diene dazu, die Präzision der Suchergebnisse und Negativ-Effekte wie Halluzinationen zu verringern.

Die BBC sieht durch Perplexity hingegen ihre Reputation und ihre Vertrauenswürdigkeit beschädigt. Darüber hatte sie sich auch schon früher beklagt.

Anfang des Jahres veröffentlichte der Rundfunk eine Studie, die belegen soll, dass die Nachrichtenzusammenfassungen, die Perplexity und Co anbieten, häufig BBC-Informationen falsch oder in falschem Kontext wiedergeben. Hierfür forderten die Verantwortlichen der Studie die KI-Dienste auch proaktiv dazu auf, BBC-Inhalte als Quelle zu nutzen und erlaubten auch hierfür das Durchsuchen der Webseiten über die Datei robots.txt. Insgesamt stellten sie 100 verschiedene Fragen zu aktuellen nachrichtlichen Themen.

Unter anderem kamen sie zu dem Schluss: 23 Prozent der Perplexity-Antworten waren in „erheblichem“ Ausmaß unpräzise („significant issues“). Zugutehalten kann man Perplexity hier aber, dass der Anteil der Probleme „erheblichen“ Ausmaßes geringer ausfällt als bei den meisten anderen KI-Suchmaschinen.

Ende vergangenen Jahres beschwerte sich die BBC auch bei Apple über eine Falschmeldung von deren Dienst Apple Intelligence. Apple deaktivierte die Zusammenfassungen daraufhin. Wie sich die Situation mit Perplexity weiter entwickelt, bleibt abzuwarten.


(nen)



Source link

Weiterlesen

Künstliche Intelligenz

Dashcam fürs Fahrrad: Garmin Varia Vue im Test


Mit der Varia Vue verheiratet Garmin eine Fahrradlampe mit einer Kamera. Das spart Platz am Lenker, wo man sonst Licht und Actioncam separat spazieren fahren würde. Mit einem Preis von 549 Euro ist die Varia Vue jedoch kein Schnäppchen.

Das robuste Gehäuse aus Kunststoff und Metall ist sauber verarbeitet und nach IPX7 zumindest gegen Wasser geschützt. USB-Anschluss und Speicherkartenslot versteckt Garmin hinter zwei Kläppchen. An der Oberseite hat die Vue die von Actioncams bekannte Standardaufnahme. Eine Lenkerhalterung samt Adapter legt Garmin mit in den Karton. Daran dockt die Vue unten an, oben lässt sich ein Radcomputer einklicken.

Zur Einrichtung braucht es die Varia-App. Die Geräte der Varia-Serie, dazu gehören auch die mit der Vue kompatiblen Rücklichter mit Radar, werden dort gesammelt. Radcomputer, Uhren und anderes Gerät findet man in der normalen Connect-App von Garmin. Die Kopplung über Bluetooth ist schnell erledigt, die App selbst braucht man danach nur noch, um Aufnahmen einzusehen und zu speichern.


Das war die Leseprobe unseres heise-Plus-Artikels „Dashcam fürs Fahrrad: Garmin Varia Vue im Test“.
Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.



Source link

Weiterlesen

Beliebt