Apps & Mobile Entwicklung

Generatives Musikmodell: So erstellt man mit Lyria 3 kurze Soundtracks in Gemini

Google hat seinen KI-Musikgenerator Lyria 3 in Gemini integriert. Nutzern sollen damit durch einfache Prompt-Eingaben ansehnliche Musikstücke verschiedener Stilrichtungen erstellen können. Die Länge der generierten Stücke ist derzeit noch auf 30 Sekunden begrenzt, Google hat damit vor allem Videos im Blick.

Vom Text zur fertigen Musik

Das aus Googles DeepMind stammende Musikmodell soll nicht nur anhand einfacher, per Text eingegebener Beschreibungen wie gewünschtem Genre oder vorgegebener Stimmung entsprechende Tracks erzeugen können, sondern auch auf Basis von Bildern und Videos. Gemini erstellt daraufhin einen vollständigen, bis zu 30 Sekunden langen Track mit einer Abtastrate von bis zu 48 kHz. Im Gegensatz zu früheren Lyria-Versionen kann das Stück auf Wunsch direkt von der KI mit einem passenden Text versehen werden. Durch die Möglichkeit, Videos als beschreibende Quelle zu nutzen, soll sich das neue Modell zudem für die unkomplizierte musikalische Untermalung kurzer Videos eignen, die dafür lediglich hochgeladen werden müssen.

Größere Kontrolle und Einfluss

Mit dem neuen Modell erhalten Anwender zudem deutlich mehr Kontrolle über die Ausgabe – etwa hinsichtlich Stil, gewünschtem Tempo, Stimme und Stimmung, aber auch bei spezifischeren Parametern wie Tonart, Akkord-Progressionen oder der Frage, ob das Stück überwiegend Dur- oder Moll-Akkorde verwenden soll. Die Informationsrichtung kann dabei auch umgekehrt verlaufen: Auf Wunsch gibt Lyria 3 die verwendeten Akkorde aus, eine vollständige Partitur mit sämtlichen Noten ist jedoch nicht möglich. Gleiches gilt für die Ausgabe einzelner Spuren zur späteren Weiterverarbeitung oder besseren Abmischung. So lässt sich beispielsweise keine isolierte Gesangsspur erzeugen, die in eigenen Produktionen weiterverwendet werden kann.

Gleichzeitig wird für die erstellten Inhalte mittels Nano Banana ein individuelles Cover-Art generiert, das in kurzen Tests der Redaktion jedoch nur wenig überzeugen konnte und inhaltlich meist nur bedingt einen Bezug auf einen möglichen Text erkennen ließ.

Wie funktioniert Lyria 3 in der Praxis?

Die Redaktion hat Lyria 3 einem Kurztest unterzogen und versucht, dem KI-Modell mittels einfacher Prompts ein hörbares Stück zu entlocken. Bereits mit einer schlichten Eingabe wie

Eine Frauenstimme soll über das Wetter singen. Die Tonart soll in C-Dur gehalten werden, der Stil in Richtung Synthwave oder Retro-Wave gehen und ein höheres, treibendes Tempo besitzen. Das Stück soll eine fröhliche Grundstimmung besitzen und das erste schöne Frühlingswetter nach langen Regentagen beschreiben.

lässt sich bereits ein hörbares Ergebnis erzeugen.

Je detaillierter ein Prompt jedoch formuliert ist und je mehr Informationen dieser enthält, desto präziser kann die von Lyria 3 erstellte Ausgabe den eigenen Vorstellungen entsprechen. So konnte mittels

Eine Frauenstimme soll über das Wetter singen. Die Tonart soll in C-Dur gehalten werden, der Stil in Richtung Synthwave oder Retro-Wave gehen und ein höheres, treibendes Tempo besitzen. Als Akkordprogression soll I-V-vi-IV verwendet werden. Im Hintergrund soll ein das Musikstück umhüllendes Pad zu hören sein, der Bass sollte aber einen hohen Attack besitzen und leicht metallisch klingen. Background-Sänger sollen teile des Refrains wiederholen. Das Stück soll eine fröhliche Grundstimmung besitzen und das erste schöne Frühlingswetter nach langen Regentagen beschreiben. Es sollen zudem Wörter wie „Regen“, „Sonnenschein“ „Regenzeit“, „schlechtes Wetter“ und „Wolkenbruch“ verwendet werden.

deutlich mehr Einfluss auf das ausgegebene Musikstück genommen werden.

Dabei eignet sich Lyria 3 ebenso für die Erstellung skurriler oder humorvoller Stücke:

Eine Männerstimme soll den deutschen liebstes Fleischgericht besingen: Das Schnitzel! Die Musik soll vom Stil der stampfend sein und nach einem deftigen Wirtshaus klingen. Dementsprechend soll auch die Musik angepasst sein. Etwas Blasmusik wäre ebenfalls schön, der Hintergrund ansonsten schlagermäßig synthetisch klingen. Das Stück soll zudem ein mittleres, eher gemütliches Tempo besitzen, das zum Schunkeln einlädt.

Gerade dieses Stück zeigt, dass KI-Modelle wie Lyria 3 künftig vor allem in der Werbung stärkere Verbreitung erfahren könnten.

Nicht selten erweist es sich zudem als vorteilhaft, einen Prompt mehrfach einzugeben, da Lyria 3 bei jeder erneuten Generierung unterschiedliche Stücke präsentiert und so eine größere Auswahl zur Verfügung stellt.

Identifikation von KI-Inhalten soll einfacher werden

Google hat eigenen Angaben zufolge bei Lyria 3 nicht nur Nutzerfreundlichkeit und Qualität gesteigert, sondern zugleich erweiterte Möglichkeiten geschaffen, um mit dem KI-Modell erzeugte Inhalte leichter identifizieren zu können. So werden alle in Gemini erstellten Stücke mit dem hauseigenen SynthID-System versehen, das die Inhalte mit einem nicht sichtbaren Wasserzeichen markiert. Ein Musikstück kann dazu einfach in die Gemini-App geladen und auf SynthID überprüft werden. Google betont zudem, dass Lyria 3 auf den „künstlerischen Ausdruck ausgelegt“ sei, nicht jedoch auf das gezielte Nachahmen bestehender Künstler. Diese können in Prompts zwar genannt werden, das System nutzt sie dann jedoch lediglich als Inspiration und versucht, einen ähnlichen Track im Stil der jeweiligen Band oder des Künstlers zu erzeugen. Für eine bessere Nutzung von Prompts stellt Google Nutzern darüber hinaus zahlreiche Hilfestellungen bereit.

Creator können Lyria 3 ab sofort auch in Dream Track verwenden, dem experimentellen KI-Tool von YouTube zur klanglichen Untermalung von YouTube Shorts. Dieses war bislang ausschließlich in den USA verfügbar und wurde nun auch für weitere Länder freigeschaltet.

(Noch) Kein professionelles Werkzeug

Auch wenn die Fähigkeiten von Googles Musik-Tool deutlich erweitert wurden, ordnet es sich weiterhin klar hinter professionellen Lösungen wie Suno AI oder Udio ein. Die von Google genannten Einsatzszenarien verdeutlichen, dass sich Lyria 3 primär an normale Nutzer und Contentcreator richtet, die mit einfachen Methoden ein Musikstück für den Hintergrund ihrer Bilder oder Videos erstellen möchten und keine tiefgreifende Kontrolle benötigen.

Ab sofort verfügbar

Lyria 3 ist ab sofort in Gemini für alle Nutzer ab 18 Jahren auf Deutsch, Englisch, Französisch, Hindi, Japanisch, Koreanisch, Portugiesisch und Spanisch verfügbar. Weitere Sprachen sind Google zufolge geplant. Abonnenten von Google AI Plus, Pro und Ultra erhalten zudem höhere Nutzungslimits, zu deren konkreter Ausgestaltung Google bislang jedoch keine weiteren Informationen veröffentlicht hat.

Source link

Verwandte Themen:erstellt Gemini Generatives kurze Lyria Man MIT Musikmodell Soundtracks

Up Next

Samsung-Notebooks: Galaxy Book 6 (Pro/Ultra) startet am 11. März ab 1.049 Euro

Nicht verpassen

Amazon: KI-Coding-Bots verursachten AWS-Ausfälle – ComputerBase

Apps & Mobile Entwicklung

Mehrere Gigawatt Rechenleistung: Anthropic baut Partnerschaft mit Google und Broadcom aus

Anthropic sucht weiterhin nach Wegen, die eigenen Kapazitätsengpässe zu beheben. Dazu hat das Unternehmen nun eine Partnerschaft mit Google und Broadcom angekündigt, die mehrere Gigawatt an TPU-Kapazität ermöglichen soll. Davon könnten auch Drittanbieter-Agenten profitieren, die zuletzt noch blockiert worden waren.

Knappe Kapazitäten führen zum Ausschluss von externen Agenten

Diese Engpässe waren von Kunden von Claude Code oder Cowork insbesondere zu Stoßzeiten bemerkt und kritisiert worden, weshalb sich Anthropic zu dem Schritt gezwungen sah, seine KI-Dienste für Drittanbieter-Tools wie OpenClaw zu sperren. Laut Claude-Code-Entwickler Boris Cherny seien Anthropics Kapazitäten nicht auf den Ansturm solcher Drittanbieter-Tools ausgelegt.

Mehr Rechenleistung in den USA ab nächstem Jahr

Mit der nun mit den Konzerngrößen Google und Broadcom geschlossenen Partnerschaft soll diesem Engpass entgegengewirkt werden. Die unterzeichnete Vereinbarung sieht vor, voraussichtlich ab 2027 mehrere „Gigawatt TPU-Kapazitäten der nächsten Generation“ aufzubauen, wie Anthropic in einem veröffentlichten Blog-Beitrag erklärt. Mit dieser Maßnahme soll zu diesem Zeitpunkt der Ausbau der eigenen Recheninfrastruktur beginnen, um die weltweit gestiegene Nachfrage nach KI-Diensten des Unternehmens bedienen zu können. „Wir bauen die Kapazitäten auf, die erforderlich sind, um dem exponentiellen Wachstum unserer Kundenbasis gerecht zu werden, so Krishna Rao, CFO bei Anthropic, im Beitrag.

Der Großteil der neuen Kapazitäten soll in den Vereinigten Staaten entstehen und damit die im November 2025 angekündigten Investitionen von 50 Milliarden US-Dollar in den Ausbau der amerikanischen Recheninfrastruktur unterstützen. Anthropic will dabei weiterhin auf eine hohe Diversität setzen, bei der verschiedene KI-Hardware wie AWS Trainium, Google TPU und NVIDIA-GPU zum Einsatz kommen, sodass für unterschiedliche Anforderungen die jeweils passende Technologie genutzt wird. Diese Vielfalt an Plattformen soll nicht nur die Leistung steigern, sondern auch die Ausfallsicherheit erhöhen, insbesondere für Kunden, die bei kritischen Anwendungen auf Claude angewiesen sind.

Anthropic will breit aufgestellt bleiben

Amazon soll trotz der neu geschlossenen Partnerschaft weiterhin sowohl primärer Cloud-Anbieter als auch Trainingspartner von Anthropic bleiben, zugleich soll die enge Zusammenarbeit mit AWS am Projekt Rainier fortgeführt werden. Claude soll dabei allerdings weiterhin das einzige wegweisende KI-Modell bleiben, das Kunden auf allen drei der weltweit größten Cloud-Plattformen zur Verfügung steht: Amazon Web Services (Bedrock), Google Cloud (Vertex AI) und Microsoft Azure (Foundry).

Erfolg fordert Maßnahmen

Diese Investitionen gelten auch als notwendig, da sich der Zustrom neuer Kunden im Jahr 2026 weiter beschleunigt hat. Der Run-Rate-Umsatz von Anthropic – eine betriebswirtschaftliche Kennzahl, die den aktuellen Umsatz eines Unternehmens auf ein volles Jahr hochrechnet – lag Ende 2025 bei rund 9 Milliarden US-Dollar und soll im laufenden Jahr auf 30 Milliarden US-Dollar ansteigen. Mit der Finanzierungsrunde im Februar 2026 hatte Anthropic mitgeteilt, dass rund 500 Geschäftskunden jeweils mehr als eine Million US-Dollar pro Jahr ausgeben; mittlerweile hat sich diese Zahl innerhalb von weniger als zwei Monaten auf 1.000 verdoppelt.

Source link

Apps & Mobile Entwicklung

Epub- und PDF-Format: Amazon beginnt, DRM-freie E-Books zu kennzeichnen

Amazon hat zu Jahresbeginn eine regelrechte Kehrtwende vollzogen und bietet digitale Bücher nun auch im Epub- und PDF-Format sowie ohne DRM an. Inzwischen hat das Unternehmen zudem damit begonnen, entsprechende Titel im Sortiment sichtbar und nachvollziehbar zu kennzeichnen – zumindest in den USA.

Amazon geht zumindest kleinen Schritt auf Kunden zu

Dieser Schritt steht im deutlichen Kontrast zu den Veränderungen, die Kunden bei Amazon im Bereich digitaler Bücher in jüngerer Zeit hinnehmen mussten. So stellte das Unternehmen im Februar des vergangenen Jahres zunächst den Download von E-Books ein, bevor im September ein neues DRM-System eingeführt wurde. Vor rund einem Monat folgten schließlich Berichte, wonach Amazon sein DRM-System sogar ohne Firmware-Update auf Kindle-Readern weiter verschärft habe.

Vor diesem Hintergrund wirkt ein Bericht von Good e-Reader beinahe wie ein Entgegenkommen des Unternehmens. Demnach hat Amazon damit begonnen, digitale Bücher im Epub- und PDF-Format ohne digitales Rechte-Management entsprechend zu kennzeichnen. Derzeit scheint diese Praxis jedoch ausschließlich auf die USA beschränkt zu sein, zumindest konnten Stichproben der Redaktion im deutschsprachigen Angebot keine entsprechenden Hinweise zutage fördern.

DRM-freie Bücher ab sofort mit entsprechendem Hinweis

Entsprechende Titel sind neuerdings mit dem Zusatz „At the Publisher’s request, this title is being sold without Digital Rights Management Software (DRM) applied“ versehen. Darüber hinaus findet sich an anderer Stelle in den Produktdetails ein weiterer Hinweis, der ebenfalls auf das fehlende DRM-System aufmerksam macht. So wird bei diesen Büchern angegeben, dass die gleichzeitige Nutzung auf mehreren Geräten unbegrenzt möglich ist, ein Umstand, der üblicherweise durch DRM eingeschränkt wird. Laut Bericht ist die Zahl entsprechender Titel bislang noch gering und beschränkt sich auf wenige Verlage oder Plattformen, es gilt jedoch als wahrscheinlich, dass weitere Anbieter folgen werden.

DRM-freie Bücher bislang nur auf wenige Formate beschränkt

Seit Ende des vergangenen Jahres liegt die Entscheidung bei Autoren und Verlagen, ob E-Books ohne Kopierschutz angeboten werden sollen. In diesem Fall stehen die Titel allerdings ausschließlich im Epub- oder PDF-Format zur Verfügung. Ob Amazon sein restriktives DRM auch für die eigenen Formate AZW beziehungsweise KFX entsprechend anpassen wird, ist bislang nicht bekannt.

Source link

Apps & Mobile Entwicklung

Mehr EUV-Systeme von ASML: SK Hynix zahlt Premium-Preise für extra schnelle Lieferung

Die Bestellung in Milliardenhöhe von SK Hynix bei ASML vor wenigen Tagen und dabei anvisierten Lieferzeiten nur bis Ende 2027 warf einige Fragen auf, wie das denn umgesetzt werden kann. Ein Teil der Fragestellung wird wohl durch höhere Preise beantwortet werden.

Ende März kündigte SK Hynix offiziell an, für 6,913 Milliarden Euro bei ASML EUV-Systeme zu kaufen. Vor allem der dabei anvisierte Zeitraum überraschte, ist er doch ein ziemlich kurzer. Denn pro Jahr baut ASML nicht einmal 50 EUV-Systeme – zuletzt waren es im Jahr 2024 44 Systeme und 2025 48 Systeme – deren Stückpreis zuletzt jedoch deutlich angestiegen sein soll. Es waren vor einigen Jahren wohl zum Auftakt nur 140 Millionen Euro pro System, dann 160 Millionen, 180 Millionen und nun sollen es wohl 200 Millionen Euro und mehr sein.

EUV-Scanner werden immer besser

Der höhere Preis begründet sich dabei aber nicht nur in den gestiegenen Materialkosten und sonstigen Veränderungen im Markt, sondern vor allem auch in der Aufwertung der Maschinen. Ein modernster Twinscan NXE:3800E, wie das Flaggschiff der EUV-Systeme heißt, belichtet heutzutage viel mehr Wafer als die ersten Systeme dieser Baureihe. Die Produktivität wurde zuletzt auf über 220 Wafer pro Stunde gesteigert, ein NXE:3400C aus dem Jahr 2020 schaffte kaum 135 Wafer die Stunde.

Wie üblich bei ASML können die Systeme auch im Einsatz aufgewertet werden, in Zukunft soll die Produktivität weiter steigen (und vermutlich auch der Preis).

High-NA-Systeme auf ASMLs Roadmap nebst aufgewerteten EUV-Systemen (Bild: ASML)

Südkoreanische Medien berichten, dass der Preis pro System nun sogar bei umgerechnet 230 Millionen Euro liegen könnte. Hinzu kommt nun angesichts des sehr kurzen Zeitfensters der Lieferungen, dass SK Hynix wohl einen Aufschlag von 15 bis 20 Prozent zahlen könnte, was zum Teil jedoch damit verrechnet wird, dass es bei Großbestellungen gewisse Rabatte gibt. So etwas ist in der Halbleiterindustrie nichts außergewöhnliches, auch die Chip-Hersteller verkaufen gern Premium-Slots in der Fertigung zu höheren Preisen – der Kunde bekommt dafür seine Produkte früher.

High-NA-EUV in der Erprobung

Am Ende wird damit gerechnet, dass SK Hynix wohl rund 20 EUV-Systeme abnehmen wird. High-NA-EUV-Scanner sollen letztlich kein Bestandteil dieser Bestellung sein, einen davon nutzt SK Hynix in der aktuellen Ausbaustufe bereits in der Erprobung.

Source link