Online Marketing & SEO
OmniAvatar: So realistisch ist Alibabas neues KI-Videomodell
Ein Bild, eine Stimme, ein Prompt – mehr braucht OmniAvatar nicht für hyper-realistische KI-Videos mit Körpersprache. Das Modell ist zudem frei verfügbar als Open Source.
Digitale Avatare erhalten ein realistisches Update: Mit OmniAvatar hat die Alibaba Group gemeinsam mit der Zhejiang-Universität ein Open-Source-Modell veröffentlicht, das sprachgesteuerte, ganzkörperanimierte Videos generiert. Anders als viele bestehende Ansätze beschränkt sich die Technologie nicht auf die Synchronisation von Lippenbewegungen, sondern erlaubt komplexe Körpersprache, Emotionen und sogar Objektinteraktionen. Das KI-Tool markiert damit einen neuen Standard für automatisierte Videoproduktion. Auf der Projektseite demonstriert ein Video, welches kreative und technische Potenzial das Modell für die KI-Videoproduktion bietet.
Nach DeepSeek:
Jetzt bringt auch Alibaba neue Super-KI

Vom Sprachsignal zur Körpersprache: So funktioniert OmniAvatar
Im Zentrum von OmniAvatar steht ein multimodales KI-System, das Audiodaten, Bilder und Text-Prompts miteinander verknüpft. Das Audio wird mit einem Wav2Vec-Modell analysiert, das Sprachmerkmale auf Frame-Ebene extrahiert. Diese Merkmale werden in ein latentes Raumformat übertragen und mit visuellen Informationen aus einem Referenzbild kombiniert. Ein LoRA-basiertes Training erlaubt es dem Modell, zusätzliche Steuerungspunkte wie Emotionen, Gesten oder Blickrichtungen präzise zu integrieren – bei gleichzeitiger Effizienz und Wiederverwendbarkeit.

Die präzise Steuerung ist laut den Entwickler:innen durch eine pixelweise, multihierarchische Audioeinbettung möglich. Diese trägt entscheidend zur exakten Lippensynchronisation bei und verbessert laut der Veröffentlichung sogar die Generalisierungsfähigkeit über verschiedene Szenen hinweg. Einen praktischen Eindruck vermitteln Demos wie ein Beispiel für eine natürliche Präsentation oder ein Avatar in freier Gestikulation.
Regiefunktion per Prompt: OmniAvatar als Baukasten für Videokommunikation
Besonders bemerkenswert an OmniAvatar ist die intuitive Steuerung über einfache Texteingaben. Nutzer:innen können per Prompt bestimmen, ob der Avatar lächeln, überrascht oder wütend wirken soll – oder ob die Szene etwa in einem Cybercafé oder unter einem Zitronenbaum spielt. In diesem Beispielvideo erscheint die Figur in einer natürlichen Umgebung, während die Kamera langsam herauszoomt.
Diese Steuerungslogik macht OmniAvatar besonders interessant für den Einsatz in Marketing, Medienproduktion oder im Bildungsbereich. Laut einem Post von AI-Entwickler luokai sei die Steuerung so intuitiv, dass sich Anwendungen wie Podcast-Moderationen, virtuelle Präsentationen oder gesungene Performances in hoher Qualität realisieren lassen – ohne klassisches Motion Capturing.
Bemerkenswert ist auch die Offenheit der Technologie: OmniAvatar wurde als Open-Source-Modell auf GitHub veröffentlicht und ist somit frei zugänglich. Damit setzt Alibaba einen klaren Impuls in Richtung kollaborative Forschung und dezentrale Content-Produktion. Auch andere Entwicklungen der Alibaba Cloud AI Labs – wie Qwen 2.5‑Max, Anfang 2025 veröffentlicht, und inzwischen auch das jüngste Qwen 3‑Modell – zeigen, dass das Unternehmen zunehmend eigene technologische Standards setzt.
Videokommunikation neu gedacht
OmniAvatar hebt die Möglichkeiten generativer KI für Bewegtbildinhalte auf ein neues Niveau. Durch die Kombination aus präziser Lippensynchronisation, adaptiver Körpersprache und intuitiver Prompt-Steuerung entstehen realistische, ganzkörperanimierte Avatare, ganz ohne Studio, Schauspiel oder Green Screen. Für Marketing und Content Teams entstehen dadurch neue Möglichkeiten, etwa:
- personalisierte Avatarvideos für Social Media oder E-Mail-Kampagnen,
- skalierbare Content-Formate für Präsentationen, Podcasts oder Tutorials,
- KI-basierte Brand Ambassadors mit glaubwürdiger Mimik und Gestik,
- virtuelle Figuren für Events, Plattformen oder interne Schulungen.
Statt statischer Talking Heads ermöglichen solche Avatare eine neue Form automatisierter, aber dennoch glaubhafter Kommunikation – mit Ausdruck, Dynamik und Kontextbezug.
Auch strategisch kann OmniAvatar für Unternehmen relevant sein: Die Open-Source-Architektur erlaubt es, eigene virtuelle Sprecher:innen oder Assistent:innen zu entwickeln und zu skalieren. Besonders in internationalen Märkten, in denen Inhalte zunehmend automatisiert lokalisiert und ausgespielt werden, könnte das Modell neue Standards setzen.
Neue Qualität für skalierbare Videokommunikation
OmniAvatar erweitert das Potenzial generativer KI deutlich. Durch die Kombination aus präziser Lippensynchronisation, adaptiver Körpersprache und textbasierter Steuerung wird eine neue Stufe visueller Ausdruckskraft erreicht – ohne hohen Produktionsaufwand. Für Marketing und Content Teams eröffnet das Modell neue Wege für automatisierte, aber dennoch glaubwürdige digitale Kommunikation.
Online Marketing & SEO
Fußball-Bundesliga: Ebay wird Premium-Sponsor des 1. FC Union Berlin
Das Ebay-Logo wird unter anderem die Spiele auf den TV-relevanten LED-Banden im Stadion „An der Alten Försterei“ begleiten.
Der Online-Marktplatz Ebay wird Partner des Fußball-Bundesligisten 1. FC Union Berlin. Zum Start der anstehenden Saison 2025/26 wird die E-Commerce-Plattform nicht nur in der Heimspielstätte und den Vereinsmedien sichtbar, sondern will Fans auch näher an ihren Verein bringen.
Ebay Deutschland wird ab der Saison 2025/2026 der Fußball-Bundesliga neuer Premium-Sponsor des 1. FC Union Berlin. Im Rahmen der Partnerschaft s
Diesen Artikel gratis weiterlesen!
Jetzt kostenfrei registrieren.
Die Registrierung beinhaltet
das HORIZONT Newsletterpaket.
Sie sind bereits registriert?
Hier anmelden
Der Nutzung Ihrer Daten können Sie jederzeit widersprechen. Weitere Hinweise finden Sie unter Datenschutz.
Online Marketing & SEO
Top 20 Werbespender: Carglass repariert … jetzt auch den deutschen Werbemotor
Carglass hebt seine Werbeausgaben an
Der deutsche Werbemarkt kommt nicht so richtig in Fahrt. Sowohl der Blick auf den Juli, in dem die Brutto-Werbeausgaben wie berichtet um 0,3 Prozent sanken, als auch der aufs Gesamtjahr (plus 0,4 Prozent) zeigt, dass die Werbeplätze der Medien derzeit nicht wirklich aus allen Nähten platzen. Dennoch gibt es Unternehmen, die den Werbedruck massiv erhöhen. Zum Beispiel Carglass.
Auf den ersten Blick sieht das Ranking der deutschen Top 20 Werbespender für den Monat Juli ganz ordentlich aus. Von den 20 Unternehmen, die im l
Diesen Artikel gratis weiterlesen!
Jetzt kostenfrei registrieren.
Die Registrierung beinhaltet
das HORIZONT Newsletterpaket.
Sie sind bereits registriert?
Hier anmelden
Der Nutzung Ihrer Daten können Sie jederzeit widersprechen. Weitere Hinweise finden Sie unter Datenschutz.
Online Marketing & SEO
AI-Folge: Google stoppt Language Targeting für Suchkampagnen
Ende 2025 wird manuelles Language Targeting bei Google entfernt. Die AI soll übernehmen. Doch das könnte auch mal schiefgehen.
Ab 2026 gibt es beim Targeting für Googles Search Campaigns eine deutliche Änderung. Die Einstellung für das Language Targeting soll entfernt werden. Google setzt im großen Stil auf KI, auch bei anderen Werbekontexten. Beim Targeting könnte es aber zu einem Problem kommen.
Ärger auf Google:
Verstecktes Sponsored-Label und indexierte Maps-Ergebnisse

Google überlässt das Language Targeting bei Suchkampagnen der KI
Ezra Sackett, seines Zeichens Head of Paid Search beim Werbeunternehmen Monks, hat in der Dokumentation für das Sprachen-Targeting in Google Ads ein wichtiges Update entdeckt. Ein Einschub weist darauf hin, dass Google zum Ende des Jahres die Einstellung für das Language Targeting einstellt; bei Non-Search-Kampagnen bleibt die Funktionalität aber erhalten. Vielmehr soll Googles KI nun selbst ermitteln, in welcher Sprache User beworben werden sollten. Dieses Update teilt Sackett auf LinkedIn und schreibt:
[…] I’m hopeful this will be a net positive and make campaign management/structure easier in the long run but realistically there will probably be some messy mismatched languages with copy in the initial roll out.
Tatsächlich könnte es beim KI-gestützten Sprach-Targeting an der einen oder anderen Stelle zu Problemen kommen, da auch Googles KI keineswegs fehlerfrei wird agieren können. Die KI nutzt nur Daten-Touchpoints, die Marketer könnten das Targeting mit ihrer Expertise und Kenntnis der Zielgruppen anreichern. Womöglich trauern manche Marketer der Funktionalität hinterher. Dabei wird die Notiz zum Ende derselben nicht überall angezeigt, auch wir sehen sie in der Dokumentation nicht. Wenn das Update kommt, sollte es aber in Bereichen mit mehreren Sprachen auch Vorteile bei der Suchkampagnenentwicklung mit sich bringen.
Marketer können in diesem Schritt einen weiteren Hinweis auf die Entwicklung zur Vollautomatisierung von Kampagnen erkennen, wie sie auch Meta für 2026 vorsieht.
Zäsur im Online Marketing:
Meta will Ad-Kreation 2026 mit KI komplett automatisieren

Derweil baut Google das eigene Werbeangebot besonders im KI-Kontext aus. Neben den Ads in AI Overviews sollen insbesondere Werbeanzeigen im AI Mode künftig für noch mehr Inventarräume und Umsatz sorgen. Schon im zweiten Quartal 2025 steigerte Alphabet den Umsatz allein mit Google-Werbung auf 54,2 Milliarden US-Dollar.
So pitcht Google jetzt AI Mode Ads für den großen Roll-out

-
Datenschutz & Sicherheitvor 2 Monaten
Geschichten aus dem DSC-Beirat: Einreisebeschränkungen und Zugriffsschranken
-
Apps & Mobile Entwicklungvor 2 Monaten
Metal Gear Solid Δ: Snake Eater: Ein Multiplayer-Modus für Fans von Versteckenspielen
-
Online Marketing & SEOvor 2 Monaten
TikTok trackt CO₂ von Ads – und Mitarbeitende intern mit Ratings
-
Digital Business & Startupsvor 2 Monaten
10.000 Euro Tickets? Kann man machen – aber nur mit diesem Trick
-
UX/UI & Webdesignvor 2 Monaten
Philip Bürli › PAGE online
-
Digital Business & Startupsvor 2 Monaten
80 % günstiger dank KI – Startup vereinfacht Klinikstudien: Pitchdeck hier
-
Social Mediavor 2 Monaten
Aktuelle Trends, Studien und Statistiken
-
Apps & Mobile Entwicklungvor 2 Monaten
Patentstreit: Western Digital muss 1 US-Dollar Schadenersatz zahlen