Die Rüstungsrunde im Bereich der KI-gestützten Musikgenerierung bekommt neuen Zündstoff: ElevenLabs, bislang vor allem für realistische KI-Sprachmodelle bekannt, hat mit Music v2 die zweite Version seines Musikmodells vorgestellt. Das Update bringt nicht nur spielerische Features wie Genre-Wechsel mitten im Song, sondern adressiert mit einem Lizenz-fokussierten Ansatz auch den größten Schmerzpunkt der Branche.
Von der Oper zum Heavy Metal – und zurück
Die Fähigkeiten von Music v2 klingen auf den ersten Blick wie ein musikalisches Paradoxon: Das Modell soll in der Lage sein, mitten in einem Track nahtlos von Oper zu Heavy Metal zu wechseln und wieder zurückzukehren. Auch extrem schnelle Rap-Passagen sollen ohne die typischen KI-Aussetzer oder „Halluzinationen“ im Rhythmus bewältigt werden. Darüber hinaus kann das Modell nicht-musikalische Soundeffekte in einen Track integrieren – ein Detail, das für die post-produktive Nutzung enorm relevant ist.
Interessanter als die reinen Stilwechsel ist jedoch die methodische Weiterentwicklung der Songgenerierung. Anstatt wie bisher üblich nur kurze, zusammenhängende Clips aus dem Text-Prompt zu generieren, ermöglicht Music v2 einen modularen Aufbau. Nutzer können einen Song abschnittsweise konstruieren – Intro, Verse, Chorus – und diese dann zusammenfügen. Ist ein Teil nicht zufriedenstellend, lässt sich dieser isoliert über einen neuen Prompt neu generieren, ohne den Rest des Tracks zu zerstören. Dieser Ansatz erinnert an das „Inpainting“ aus der Bildgenerierung und ist ein logischer Schritt, um KI-Musik von kurzen Demos hin zu vollständigen, produzierten Tracks zu bringen.
Der Elefant im Raum: Urheberrecht und Lizenzierung
Während die technischen Spielereien Aufmerksamkeit erregen, ist die wichtigste Neuerung von Music v2 unsichtbar: die Datenbasis. ElevenLabs betont ausdrücklich, dass das Modell auf lizenzierten Daten trainiert und für die kommerzielle Nutzung freigegeben wurde.
Das ist kein Zufall, sondern ein strategischer Schachzug. Die KI-Musikbranche steht unter massivem rechtlichem Beschuss. Konkurrenten wie Suno und Udio werden derzeit von großen Plattenfirmen mit Klagen überzogen, weil sie mutmaßlich urheberrechtlich geschütztes Material ohne Zustimmung für das Training verwendet haben. ElevenLabs positioniert sich mit Music v2 als die rechtlich sichere Alternative – ein enormer Wettbewerbsvorteil, insbesondere für B2B-Kunden und Agenturen, die kein Risiko eingehen wollen. Strukturierte Lizenzverträge mit Labels sind der Schlüssel, um in der Professionalisierung der KI-Musik nicht an juristischen Hürden zu scheitern.
Der Markt heizt sich ein
Der Launch von Music v2 kommt zu einem Zeitpunkt, an dem der Markt für KI-Musik extrem dynamisch ist. Google hat auf der I/O mit „Flow Music“ ähnliche Bearbeitungsfunktionen vorgestellt, auch Stability AI und Suno rüsten auf. Die Devise lautet: Längere Tracks, komplexere Strukturen und mehr Kontrolle für den Nutzer. Die Zeit, in der KI-Musik nur aus kurzen, wirren Loops bestand, ist endgültig vorbei.
Kritische Einordnung: Werkzeug statt Künstlerersatz
Die Frage bleibt, wofür diese Technik genutzt wird. ElevenLabs integriert das Modell in sein Tool „ElevenCreative“ sowie die neue Plattform „ElevenMusic“, was die Zielgruppe klar macht: Marketing- und Branding-Teams, die lizenzfreie Jingles, Hintergrundmusik oder Soundtracks für Werbevideos benötigen. Der echte Musiker oder Produzent wird hier weniger adressiert als die Content-Maschine, die täglich kostengünstiges Material benötigt.
Technologisch ist Music v2 ein beeindruckender Sprung. Die Fähigkeit, Songs strukturell aufzubauen und Teile isoliert neu zu generieren, hebt die Qualität der Outputs auf ein neues Level. Dennoch bleibt die KI-Musik im direkten Vergleich mit menschlicher Produktion oft steril. Die Innovation liegt hier weniger in der kreativen Seele der Musik, sondern in der Demokratisierung und Automatisierung von funktionalem Sounddesign. Wer für eine Werbekampagne in drei Minuten einen Song braucht, der von Jazz zu Dubstep wechselt und rechtlich 100 Prozent sicher ist, wird mit Music v2 bestens bedient. Die eigentliche Kunst besteht weiterhin darin, dass dieser Genre-Wechsel nicht nur technisch funktioniert, sondern auch musikalisch Sinn ergibt.
Quelle: TechCrunch AI