Connect with us

Online Marketing & SEO

OmniAvatar: So realistisch ist Alibabas neues KI-Videomodell


Ein Bild, eine Stimme, ein Prompt – mehr braucht OmniAvatar nicht für hyper-realistische KI-Videos mit Körpersprache. Das Modell ist zudem frei verfügbar als Open Source.

Digitale Avatare erhalten ein realistisches Update: Mit OmniAvatar hat die Alibaba Group gemeinsam mit der Zhejiang-Universität ein Open-Source-Modell veröffentlicht, das sprachgesteuerte, ganzkörperanimierte Videos generiert. Anders als viele bestehende Ansätze beschränkt sich die Technologie nicht auf die Synchronisation von Lippenbewegungen, sondern erlaubt komplexe Körpersprache, Emotionen und sogar Objektinteraktionen. Das KI-Tool markiert damit einen neuen Standard für automatisierte Videoproduktion. Auf der Projektseite demonstriert ein Video, welches kreative und technische Potenzial das Modell für die KI-Videoproduktion bietet.


Nach DeepSeek:
Jetzt bringt auch Alibaba neue Super-KI

Alibabas Qwen 2.5
Alibabas Qwen 2.5, © eigener Screenshot

Vom Sprachsignal zur Körpersprache: So funktioniert OmniAvatar

Im Zentrum von OmniAvatar steht ein multimodales KI-System, das Audiodaten, Bilder und Text-Prompts miteinander verknüpft. Das Audio wird mit einem Wav2Vec-Modell analysiert, das Sprachmerkmale auf Frame-Ebene extrahiert. Diese Merkmale werden in ein latentes Raumformat übertragen und mit visuellen Informationen aus einem Referenzbild kombiniert. Ein LoRA-basiertes Training erlaubt es dem Modell, zusätzliche Steuerungspunkte wie Emotionen, Gesten oder Blickrichtungen präzise zu integrieren – bei gleichzeitiger Effizienz und Wiederverwendbarkeit.

Architekturübersicht des OmniAvatar-Modells, © OmniAvatar

Die präzise Steuerung ist laut den Entwickler:innen durch eine pixelweise, multihierarchische Audioeinbettung möglich. Diese trägt entscheidend zur exakten Lippensynchronisation bei und verbessert laut der Veröffentlichung sogar die Generalisierungsfähigkeit über verschiedene Szenen hinweg. Einen praktischen Eindruck vermitteln Demos wie ein Beispiel für eine natürliche Präsentation oder ein Avatar in freier Gestikulation.

Regiefunktion per Prompt: OmniAvatar als Baukasten für Videokommunikation

Besonders bemerkenswert an OmniAvatar ist die intuitive Steuerung über einfache Texteingaben. Nutzer:innen können per Prompt bestimmen, ob der Avatar lächeln, überrascht oder wütend wirken soll – oder ob die Szene etwa in einem Cybercafé oder unter einem Zitronenbaum spielt. In diesem Beispielvideo erscheint die Figur in einer natürlichen Umgebung, während die Kamera langsam herauszoomt.

Diese Steuerungslogik macht OmniAvatar besonders interessant für den Einsatz in Marketing, Medienproduktion oder im Bildungsbereich. Laut einem Post von AI-Entwickler luokai sei die Steuerung so intuitiv, dass sich Anwendungen wie Podcast-Moderationen, virtuelle Präsentationen oder gesungene Performances in hoher Qualität realisieren lassen – ohne klassisches Motion Capturing.

Bemerkenswert ist auch die Offenheit der Technologie: OmniAvatar wurde als Open-Source-Modell auf GitHub veröffentlicht und ist somit frei zugänglich. Damit setzt Alibaba einen klaren Impuls in Richtung kollaborative Forschung und dezentrale Content-Produktion. Auch andere Entwicklungen der Alibaba Cloud AI Labs – wie Qwen 2.5‑Max, Anfang 2025 veröffentlicht, und inzwischen auch das jüngste Qwen 3‑Modell – zeigen, dass das Unternehmen zunehmend eigene technologische Standards setzt.

Videokommunikation neu gedacht

OmniAvatar hebt die Möglichkeiten generativer KI für Bewegtbildinhalte auf ein neues Niveau. Durch die Kombination aus präziser Lippensynchronisation, adaptiver Körpersprache und intuitiver Prompt-Steuerung entstehen realistische, ganzkörperanimierte Avatare, ganz ohne Studio, Schauspiel oder Green Screen. Für Marketing und Content Teams entstehen dadurch neue Möglichkeiten, etwa:

  • personalisierte Avatarvideos für Social Media oder E-Mail-Kampagnen,
  • skalierbare Content-Formate für Präsentationen, Podcasts oder Tutorials,
  • KI-basierte Brand Ambassadors mit glaubwürdiger Mimik und Gestik,
  • virtuelle Figuren für Events, Plattformen oder interne Schulungen.

Statt statischer Talking Heads ermöglichen solche Avatare eine neue Form automatisierter, aber dennoch glaubhafter Kommunikation – mit Ausdruck, Dynamik und Kontextbezug.

Auch strategisch kann OmniAvatar für Unternehmen relevant sein: Die Open-Source-Architektur erlaubt es, eigene virtuelle Sprecher:innen oder Assistent:innen zu entwickeln und zu skalieren. Besonders in internationalen Märkten, in denen Inhalte zunehmend automatisiert lokalisiert und ausgespielt werden, könnte das Modell neue Standards setzen.

Neue Qualität für skalierbare Videokommunikation

OmniAvatar erweitert das Potenzial generativer KI deutlich. Durch die Kombination aus präziser Lippensynchronisation, adaptiver Körpersprache und textbasierter Steuerung wird eine neue Stufe visueller Ausdruckskraft erreicht – ohne hohen Produktionsaufwand. Für Marketing und Content Teams eröffnet das Modell neue Wege für automatisierte, aber dennoch glaubwürdige digitale Kommunikation.





Source link

Weiterlesen
Kommentar schreiben

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Online Marketing & SEO

3 Creator to watch: Diese TikToker haben im Mai für Aufsehen gesorgt


WeCreate stellt wieder spannende TikToker vor

Drei Creator, drei ganz eigene Strategien, um auf TikTok herauszustechen: Der eine parodiert andere Creator, sodass alle rätseln, wer gemeint ist, die nächste spielt mit Alltagsklischees und einer Synchronsprecherstimme und der dritte bleibt lieber bei Trails, Radrennen und Outdoor-Vibes – diese TikToker sind WeCreate im Mai besonders aufgefallen.

Diesen Artikel gratis weiterlesen!
Jetzt kostenfrei registrieren.

Die Registrierung beinhaltet
das HORIZONT Newsletterpaket.

Sie sind bereits registriert?

Der Nutzung Ihrer Daten können Sie jederzeit widersprechen. Weitere Hinweise finden Sie unter Datenschutz.



Source link

Weiterlesen

Online Marketing & SEO

Pride-Ranking von Yougov: Diese Marken stehen am überzeugendsten für Vielfalt


Nivea zählt zu den Marken, die als glaubwürdige Pride-Unterstützer wahrgenommen werden

Im Pride Month Juni gibt es alljährlich jede Menge Veranstaltungen und Aktionen rund um die Sichtbarkeit der LGBTQIA+-Community – auch von Markenseite. Während einige die Bewegung jedoch primär für Marketingzwecke nutzen, überzeugen andere Brands mit glaubwürdigem Engagement für mehr Vielfalt.

Auch wenn der offizielle Pride Month bereits vorbei ist, bildet er in vielen Fällen den Auftakt für etliche Feierlichkeiten, die weltwe

Diesen Artikel gratis weiterlesen!
Jetzt kostenfrei registrieren.

Die Registrierung beinhaltet
das HORIZONT Newsletterpaket.

Sie sind bereits registriert?

Der Nutzung Ihrer Daten können Sie jederzeit widersprechen. Weitere Hinweise finden Sie unter Datenschutz.



Source link

Weiterlesen

Online Marketing & SEO

How-to: Digitale Inklusion: Mit diesen Hebeln wird Barrierefreiheit zum Erfolgsfaktor für Markenführung


Digitale Barrierefreiheit ist ein Statement für gesellschaftliche Verantwortung. Wer digitale Angebote inklusiv gestaltet, stärkt nicht nur die User Experience, sondern auch das Vertrauen in die Marke. Wie dies gelingt, erklärt Rosa Groot von Think Moto.

Tastaturnavigation aller Website-Funktionen und leicht bedienbare Formulare? Fehlanzeige. Text-Vergrößerung, kontrasteiche Texte und Grafiken, aber ohne auf Inhalte zu verzichten? Ebenfalls Mangelware. Und barrierefreie Alternativen für akustische Inhalte – etwa Untertitel, Audiodeskriptionen oder Transkripte? Noch immer Wunschdenken bei vielen digitalen Produkten. Leider.

Menschen mit Behinderungen stoßen täglich auf zahlreiche Barrieren. Und das, obwohl seit Ende Juni die digitale Barrierefreiheit für viele Unternehmen – nicht nur aus dem öffentlichen Sektor, sondern auch für viele privatwirtschaftliche – gesetzliche Pflicht ist. Dabei ist Barrierefreiheit ein Ausdruck guter User Experience und inklusiver Markenführung. Wer jetzt nicht handelt, riskiert nicht nur rechtliche Konsequenzen, sondern auch den Ausschluss potenzieller Nutzer:innengruppen und einen eklatanten Verlust an Glaubwürdigkeit für die eigene Marke. Da digitale Barrierefreiheit letztlich über die Zukunftsfähigkeit von Produkten entscheidet, gilt es, Accessibility strategisch, gestalterisch und organisatorisch zu denken.

Folgende Hebel sorgen für mehr digitale und inklusivere Accessibility und ermöglichen glaubwürdige Markenführung:

Argumente für Entscheider:innen sichtbar machen

Oft scheitert Barrierefreiheit nicht an fehlendem Wissen, sondern an fehlender Priorisierung. Damit Accessibility fest in Projekte integriert sind Entscheider:innen mit klaren Argumenten zu überzeugen: Laut Statistischem Bundesamt leben in Deutschland 7,9 Millionen Menschen mit Behinderungen. Diese Zielgruppe stellt eine erhebliche Kaufkraft dar. Barrierefreiheit vergrößert also nicht nur die Reichweite, sondern verbessert die Usability für alle: Wer im Alltag abgelenkt ist, unterwegs mit dem Handy recherchiert oder unter Zeitdruck steht, profitiert genauso von klarer Struktur und zugänglichem Design wie Menschen mit Behinderung.

How-to: Digitale Barrierefreiheit

5 Tipps, wie Marken mit Typografie Inklusion gestalten

Seit Juni 2025 gilt das Barrierefreiheitsstärkungsgesetz – und stellt neue Anforderungen an die digitale Gestaltung. CXO Christopher Kollat zeigt, wie Unternehmen mit smarter Schriftwahl, Technologie und Teamarbeit echte Inklusion schaffen.

Außerdem wirkt sich Barrierefreiheit positiv auf die Markenglaubwürdigkeit aus: Studien wie der Edelman Trust Barometer belegen, dass Konsument:innen Marken mehr Vertrauen schenken, wenn diese sich aktiv für gesellschaftliche Teilhabe und Inklusion einsetzen – auch digital. Wer als Markenverantwortliche:r also rechtzeitig und umfassend investiert, spart später hohe Anpassungskosten – und zeigt Verantwortung gegenüber einer vielfältigen Gesellschaft.

Accessibility von Anfang an mitdenken

Barrierefreiheit beginnt nicht beim finalen Testing, sondern im ersten Wireframe – und idealerweise schon im Anforderungskatalog. Accessibility-Kriterien gehören deshalb von Beginn an als fester Bestandteil in Konzept, Design und Entwicklung digitaler Produkte.

Kontrastverhältnisse, sichtbare Fokus-Indikatoren und verständliche Sprache sind kein Add-on, sondern elementar für ein zugängliches Design. Auf der Website der Washington Post wird beispielsweise beim ersten Drücken der Tab-Taste ein Link zur Barrierefreiheits-Erklärung angezeigt – ein klares Zeichen, dass Tastaturnutzer:innen hier bereits im Vorfeld bedacht wurden.

Tastaturnavigation und Screenreader-Support konsequent testen

Viele Menschen verlassen sich auf Tastatur oder Screenreader – doch in der Praxis sind viele Sites kaum damit bedienbar. Deshalb reicht es nicht, Accessibility nur zu simulieren: Tests mit echten Nutzer:innen assistiver Technologien liefern wertvolle Einblicke, die automatisierte Tools nicht erfassen. Auch die Outputs von KI-Tools, deren Vorteile zweifellos auch bei der inklusiveren Gestaltung von Webangebote zum Tragen kommen – wenn es etwa um Farbkontraste geht –, sind nicht immer hilfreich.

Die Studie „So barrierefrei sind Online-Shops in Deutschland 2025“ fand beispielsweise heraus, dass der Deutschen Post bei der Tastaturbedienung im Shop ein kleiner Detail-Fehler unterlaufen ist: Im Warenkorb gibt es das Bedienelement „Nächster Schritt“. Dieser muss zwangsläufig ausgeführt werden, um den Kauf einer Brief- oder Paketmarke abzuschließen. Dieser Button ist aber nicht tastaturbedienbar. Ausführliche Tests mit echten Menschen hätte das möglicherweise ans Licht gebracht.

Sphärisch denkende Marken sind gleichzeitig ökonomisch erfolgreich, sozial wirksam und kulturell relevant, da sie verantwortungsvoll, divers und inklusiv handeln.

Rosa Groot

Weiterhin können bereits vergleichsweise einfache Maßnahmen große Wirkung zeigen. So sorgen zum Beispiel sichtbare Fokusrahmen dafür, dass Tastaturnutzer:innen jederzeit erkennen, welches Element gerade aktiv ist. Und sogenannte ARIA-Rollen (kurz für Accessible Rich Internet Applications) ermöglichen es Screenreadern, die Funktion von Seitenelementen korrekt zu interpretieren – etwa ob es sich um einen Button, ein Menü oder einen Modal bzw. Dialogfeld handelt. Sie schaffen damit eine semantische Brücke zwischen dem Code und den Hilfsmitteln, die Menschen mit Behinderungen nutzen.

Barrierefreiheit im Team leben

Barrierefreiheit kann nur gelingen, wenn alle im Team von der ersten Idee bis zur letzten Codezeile mitdenken. Inklusive UX muss gemeinsames Ziel und gelebte Praxis sein. Dafür braucht es nicht nur Schulungen und den Austausch mit Betroffenen, sondern auch saubere Übergaben innerhalb der Teams. Accessibility-Dokumentation – beispielsweise neben Komponenten einer Pattern Library in Design-Systemen oder über Checklisten – hilft, Entscheidungen nachvollziehbar zu machen und Standards konsistent umzusetzen.

Digitale Barrierefreiheit wird zunehmend zur Grundvoraussetzung für gute User Experience. Schließlich navigiert, swiped oder sucht kein Mensch wie der andere. Entsprechend gilt es, Barrierefreiheit vom Anforderungskatalog über inklusives UX-Design bis zur Integration in Design-Systeme mitzudenken. Sphärisch denkende Marken, sogenannte Spherical Brands, sind gleichzeitig ökonomisch erfolgreich, sozial wirksam und kulturell relevant, da sie verantwortungsvoll, divers und inklusiv handeln. Und damit nicht nur über die Zukunftsfähigkeit digitaler Produkte entscheiden, sondern auch Haltung zeigen.



Source link

Weiterlesen

Beliebt