Künstliche Intelligenz
Laion: KI soll die Angst in der Stimme erkennen können
EmoNet ist eine Open-Source-Suite, die KI-Systemen helfen soll, emotionale Signale in Stimme und Mimik der Menschen zu erkennen. Sie wurde von Laion und Intel gemeinsam entwickelt und steht frei zur Verfügung. Zur Suite gehören Modelle, Datensätze sowie Benchmarks.
Laion ist dafür bekannt, den Datensatz bereitzustellen, auf dessen Basis auch der Bildgenerator Stable Diffusion trainiert wurde. Es ist eine Open-Source-Initiative aus Hamburg. In einem Blogbeitrag schreibt Laion: „Ein spannendes Gebiet der heutigen Technologie ist das Streben nach künstlicher Intelligenz, die den Menschen wirklich versteht und auf einer tieferen Ebene mit ihm interagiert.“ Zwar habe es enorme Fortschritte bei etwa der Sprachverarbeitung gegeben, eine „entscheidende Dimension“ sei jedoch noch nicht verwirklicht: „echte emotionale Intelligenz“.
KI erkennt Angst
Dafür solle KI künftig offenbar „das leise Zittern der Angst in einer Stimme“ erkennen können. Bei Laion glaubt man, dass dies nicht nur ein „faszinierendes akademisches Unterfangen“ sei, „sondern eine grundlegende Notwendigkeit für die Zukunft der Zusammenarbeit zwischen Mensch und KI“. Man hat es dabei sowohl auf die Stimme als auch den Gesichtsausdruck abgesehen.
Mit EmoNet-Face bietet Laion einen Benchmark samt Datenbank mit mehr als 200.000 synthetischen Bildern von Gesichtern – unterschiedlicher Herkunft und Demografie. EmoNet-Voice ist ein Benchmark für die Erkennung von Sprachemotionen. Dazu gehören 4692 Audiobeispiele synthetischer Stimmen. 40 Kategorien für Emotionen gibt es. Zu den Emotionen gehören kognitive Zustände wie Konzentration, Verwirrung, Zweifel, physische Zustände wie Schmerzen, Müdigkeit und Intoxikation sowie soziale Emotionen wie Scham und Stolz.
Die Taxonomie der Emotionen.
(Bild: Screenshot Laion)
Ein Video mit einem Standbild zeigt, wie Satz für Satz von einer Stimme gesprochen wird, und darunter festgehalten steht, um welche Emotion es sich dabei handelt. Beispielsweise sagt die Stimme, sie gehe zu einem Filmfestival. Darunter steht etwa, es sei enthusiastisch, interessiert und optimistisch.
Aufbauend auf den eigenen Datensets hat Laion auch ein eigenes KI-Modell entwickelt, das Emotionen aus Gesichtern sowie eines, das Emotionen aus Stimmen erkennen kann: Empathic Insight-Face Model und Empathic Insight-Voice Model.
Emotionen für bessere KI-Anwendungen
Modelle, die Emotionen erkennen können, sind nicht per se verboten. Der AI Act reguliert allerdings gewisse Anwendungen dieser Technologie. Bedarf es der Fähigkeit, ein Lachen zu verstehen, um beispielsweise einen fröhlichen Menschen in einem generierten Bild darzustellen, ist hingegen Emotionserkennung am Arbeitsplatz etwa tabu. Auch hier gibt es Ausnahmen, der Pilot eines Flugzeugs etwa darf daraufhin überwacht werden, ob er müde ist.
Lesen Sie auch
Laion hat im Sinne, mittels Emotionserkennung bessere KI-Assistenten zu erschaffen. „Die Erfassung der Ausdrücke ermöglicht es KI-Assistenten, einfühlsamer, engagierter und unterstützender zu werden; Eigenschaften, die für transformative Anwendungen in den Bereichen Bildung, psychische Gesundheit, Begleitung und darüber hinaus entscheidend sind.“ Außerdem freue sich der Verein auf eine Zukunft, in der jedes Foundation-Model in der Lage ist, so gut im Voice-Acting zu sein wie Robert De Niro und Scarlett Johansson.
Mit Bud-E Whisper legt Laion zudem eine Erweiterung von OpenAIs Transkriptions-KI Whisper vor. Damit wird nicht mehr bloß der reine sprachliche Inhalt transkribiert, sondern auch der emotionale Tonfall niedergeschrieben sowie gegebenenfalls Lachen oder nach Luft schnappen und Informationen zum Sprecher wie Alter, Geschlecht. Um Bud-E Whisper zu entwickeln wurden unter anderem 5000 Stunden aus öffentlichen Vlogs und Online-Tagebüchern sowie Filmdialoge genutzt. Gemini Flash war für die Annotation der Emotionen zuständig.
(emw)
Künstliche Intelligenz
Missing Link: „Sie werden ein größeres Boot brauchen“ – 50 Jahre „Der weiße Hai“
Auch wer den Film nicht gesehen hat, kennt das akustisches Markenzeichen des „weißen Hais“: da-dum da-dum da-dum. Zwei tiefe bedrohliche Töne, die sich abwechseln, mal schneller, mal langsamer, meist mit Streichern gespielt. Der Klang der Gefahr. Beim ersten Anhören glaubt Regisseur Steven Spielberg an einen Scherz des Komponisten John Williams. Doch dann versteht er: Manchmal liegt in der Kürze die Würze.
Von den Dreharbeiten kann man das nicht behaupten. Aus 55 geplanten Tagen werden am Ende 159. Auch die Kosten verdreifachen sich. Doch am Ende zahlen sich die Mühen aus. „Der weiße Hai“ kommt am 20. Juni 1975 in die US-Kinos und wird zum ersten Film, der 100 Millionen Dollar an den US-Kinokassen einspielt. Weltweit werden es knapp 500 Millionen. Damit stößt er den drei Jahre alten Rekord von „Der Pate“ vom Thron (kann sich aber nicht lange daran erfreuen, weil zwei Jahre später „Krieg der Sterne“ erscheint).
Der Erfolg verleiht Hollywood neues Selbstbewusstsein. Die Filmbranche leidet unter dem stärker werdenden Einfluss des Fernsehens und einer gewissen Orientierungslosigkeit nach dem altbackenen Kino der Sechzigerjahre mit Stars wie Doris Day, mit denen sich vor allem das junge Publikum nicht mehr identifizieren kann.
Der erste Sommer-Hit
„Der weiße Hai“ ist der erste Sommer-Blockbuster (und steht damit sogar im Guinness-Buch der Rekorde). Blockbuster, weil sich die Besucher in langen Schlangen an den Kinokassen anstellen, die um den Häuserblock herum reichen. Und Sommer, weil zuvor wichtige Filme traditionell im Herbst und Winter starten, auch um von der Oscar-Verleihung zu profitieren. Auch „Der weiße Hai“ ist ursprünglich für Weihnachten 1974 vorgesehen, verzögert sich aber bis in den Juni. Sein großer Erfolg führt zu einem Umdenken. Weihnachten bleibt wichtig, aber statt Frühling, Herbst und Winter starten große Filme nun im Sommer. Der Film bekommt drei Fortsetzungen, die alle nicht an das Original heranreichen.
Zum Erfolg tragen zwei weitere Neuerungen bei. Bisher starten Kinofilme gestaffelt, über einen Zeitraum von Wochen und Monaten, schon allein wegen der begrenzten Anzahl an Filmrollen. „Der weiße Hai“ startet jedoch gleichzeitig in 409 Kinos.
Zudem gibt es zum ersten Mal eine große Werbekampagne im Fernsehen, das nun als Partner und nicht als Konkurrent gesehen wird. Wie im Film selbst gibt es den Hai in den TV-Spots kaum zu sehen – nur das, was er bewirkt. Die Angst, das Schreien. Dazu die ruhige und zugleich verstörende Stimme des bekannten Trailer-Sprechers Percy Rodriguez: „Es ist, als hätte Gott den Teufel erschaffen … und ihm einen Rachen gegeben.“
Natürlich hilft auch, dass sich der Roman derweil zum Bestseller entwickelt und bereits 7,5 Millionen Exemplare verkauft hat – und es dem Studio gelingt, das kultige Plakat des Films, ein riesiger Hai mit aufgerissenem Maul unter einer schwimmenden Frau, als Cover auf das Taschenbuch zu bekommen. „Der weiße Hai“ ist auch einer der ersten Filme, für die Lizenzen für verschiedenste Konsumartikel vergeben werden: T-Shirts, Unterwäsche, Tassen, Anstecker, Bücher, Spielzeug …
Der Roman
Der Roman ist das Erstlingswerk von Peter Benchley (der im Film eine kleine Gastrolle als TV-Reporter spielt). Er grübelt ewig über den Buchtitel, irgendwas mit „Jaws“ soll es sein, etwa „The Jaws of Death“, bis er den entscheidenden Tipp bekommt: „Jaws“ genügt. Im Deutschen würde keine der gängigen Übersetzungen Kiefer, Rachen, Maul ohne Zusätze funktionieren, daher: „Der weiße Hai“.
Das Werk erhält früh Aufmerksamkeit, was zu einem Bieter-Wettstreit und einem Erlös von 150.000 Dollar für die Filmrechte führt; Monate vor seinem Erscheinen. Eine erstaunliche Summe auch für den Autor, der bis dato nur einige hundert Dollar besitzt.
Spielberg sieht die Druckfahne des Buches auf dem Schreibtisch des Produzenten-Duos David Brown und Richard D. Zanuck; mit ihnen hat er bereits seinen ersten Kinofilm „Sugarland Express“ gedreht. „Jaws“. Was bedeutet das? Geht es um einen Zahnarzt? Er liest hinein, leiht sich eine Kopie und ist begeistert: Der Kampf normaler Menschen gegen eine höhere Macht erinnert ihn an seinen Fernsehfilm „Duell“, in dem ein harmloser Autofahrer von einem erbarmungslosen Truck über den Highway verfolgt wird. Und beide Titel haben vier Buchstaben.
Die Dreharbeiten
Nach einigem Hin und Her kann er den Film machen. Nur wie? Er schaut er sich alle möglichen Unterwasserfilme an, wie „20.000 Meilen unter dem Meer“, und fällt eine Entscheidung, die er im Nachhinein als „mutig und dumm“ bezeichnet: Es soll tatsächlich auf dem Meer gedreht werden, nicht im Wasserbecken des Studios, wie alle Spielfilme zuvor. Mit einer riesigen Hai-Attrappe, nicht etwa einem kleinen Modell.
Kulisse ist die malerische Ferieninsel Martha’s Vineyard an der Ostküste. Dort ist man nicht begeistert davon, dass ein großes Filmteam anrückt, mit LKWs und allerlei Apparaturen. Der Ort erhält wie im Roman den ironischen Namen Amity. Harmonie.
Für Spielberg liegt der wahre Reiz jedoch unter der Oberfläche: Er hat keinen anderen Ort gefunden, wo man weit auf das Meer fahren kann und das Wasser noch flach genug ist, um mit dem künstlichen Hai zu arbeiten. Denn für das knapp acht Meter lange Ungetüm ist eine noch größere Apparatur nötig, ein Schlitten auf einem Kran, der den Hai trägt. 12 Tonnen wiegt das Ganze.
Künstliche Intelligenz
Testing Unleashed: Coding oder nur Prompting? Software Engineering 2034
Richard Seidl hat in dieser Folge seines englischsprachigen Podcasts „Testing Unleashed“ Kevlin Henney zu Gast und spricht mit ihm über die Zukunft der Softwareentwicklung. Sie erörtern kritische Fragen zur Rolle der künstlichen Intelligenz bei der Programmierung und zur möglichen Entwicklung der Softwareentwicklung bis 2034.
Kevlin Henney meint, dass sich die Technologie zwar weiterentwickelt, viele grundlegende Aspekte der Programmierung jedoch stabil bleiben werden. In der Diskussion wird auch die Bedeutung von emotionaler Intelligenz und zwischenmenschlichen Fähigkeiten hervorgehoben und die Behauptung aufgestellt, dass das Verständnis für Menschen in einer KI-gesteuerten Landschaft zunehmend die technische Expertise übertrumpfen könnte.
„The world runs on software; that is not going anywhere.“ – Kevlin Henney
Dieser Podcast betrachtet alles, was auf Softwarequalität einzahlt: von Agilität, KI, Testautomatisierung bis hin zu Architektur- oder Code-Reviews und Prozessoptimierungen. Alles mit dem Ziel, bessere Software zu entwickeln und die Teams zu stärken. Frei nach dem Podcast-Motto: Better Teams. Better Software. Better World.
Richard Seidl spricht dabei mit internationalen Gästen über modernes Software Engineering und wie Testing und Qualität im Alltag gelebt werden können.
Die aktuelle Ausgabe ist auch auf Richard Seidls Blog verfügbar: „Coding oder nur Prompting? Software Engineering 2034 – Kevlin Henney“ und steht auf YouTube bereit.
(mdo)
Künstliche Intelligenz
Softwareentwicklung mit KI: Noch Ticket für Online-Konferenz im Juni sichern
Nach dem großen Erfolg der ersten betterCode() GenAI findet die Online-Konferenz zur KI-gestützten Softwareentwicklung am 26. Juni erneut statt.
KI-Tools wie GitHub Copilot, Cursor, Codex oder Firebase Studio haben sich inzwischen etabliert. Viele Developer schöpfen aber noch nicht das volle Potenzial aus oder zweifeln, dass die KI Code ohne Schwachstellen erzeugt.
GenAI kann mehr als Tipparbeit übernehmen
Die betterCode() GenAI zeigt, wie KI beim Testing hilft und Legacy-Code migriert. Außerdem wirft die Konferenz einen Blick auf die rechtlichen Aspekte und die Security.
Die Veranstalter iX und dpunkt.verlag haben das Programm der Konferenz aktualisiert und anhand des Feedbacks weiter verbessert. Es bietet folgende Vorträge:
- Softwareentwicklung mit Copilot, ChatGPT und Co
- Was gibt es Neues bei KI-Coding-Tools?
- Software mit KI-Unterstützung testen
- Mit ChatGPT Dinosaurier besiegen – LLMs für die Analyse alter Systeme
- Stärken und Schwächen KI-unterstützter, sicherer Softwareentwicklung
- Rechtliche Aspekte KI-gestützter Softwareentwicklung
Tickets für die Online-Konferenz kosten 329 Euro (zzgl. MwSt.). Teams ab drei Personen erhalten im Ticketshop automatisch einen Gruppenrabatt. Für den ausverkauften Workshop „Coding mit Co-Piloten: KI-Tools in der Softwareentwicklung“ gibt es jetzt einen zusätzlichen Termin am 7. Juli, für den noch Tickets verfügbar sind.
Wer über die betterCode()-Konferenzen auf dem Laufenden bleiben möchte, kann sich für den Newsletter eintragen. Die Konferenz ist auch auf LinkedIn vertreten.
(rme)
-
Online Marketing & SEOvor 1 Woche
Aus Marketing, Medien, Agenturen & Tech: Diese 40 klugen Köpfe unter 40 müssen Sie kennen
-
Social Mediavor 1 Woche
Aktuelle Trends, Studien und Statistiken
-
Social Mediavor 7 Tagen
LinkedIn Feature-Update 2025: Aktuelle Neuigkeiten
-
UX/UI & Webdesignvor 1 Woche
Kunst & KI begleitet die Münchner Standort-Eröffnung › PAGE online
-
Online Marketing & SEOvor 1 Woche
Influencer Marketing: Warum Influencer Vertrauen verlieren und klassische Medien gewinnen
-
UX/UI & Webdesignvor 1 Woche
Wie gelingt eine einwandfreie Zusammenarbeit?
-
Digital Business & Startupsvor 1 Woche
Von Peter Thiel finanziertes Krypto-Startup Bullish will an die Börse
-
Künstliche Intelligenzvor 1 Woche
Amazon soll Werbung bei Prime Video verdoppelt haben