Skąd AI kopiuje muzykę? Pewien śmiały reporter właśnie to ujawnił

W erze dostępu do technologii granica między utworami, które znaliśmy, a wytworem technologii, która używa zlepków tychże utworów, jest bardzo cienka. Można mówić wręcz o najnowszym wydaniu efektu Mandeli, czyli błędnego wspomnienia wydarzeń z przeszłości. Tylko że to z nami jest w porządku, to my jesteśmy w coraz bardziej wyrafinowany sposób oszukiwani. Reporter The Atlantic ujawnił właśnie, skąd algorytmy AI najczęściej brały inspirację, aby stworzyć "swoje" "utwory".

Jakub Krawczyński (KubaKraw)
0
Udostępnij na fb
Udostępnij na X
Skąd AI kopiuje muzykę? Pewien śmiały reporter właśnie to ujawnił

Łyżwiarze zdradzili sekret AI

Alex Reisner wspomina scenę z 2025 roku, kiedy para łyżwiarzy figurowych wykonywała układ taneczny do utworu, który przypominał "You Get What You Give" grupy New Radicals. Rozbrzmiewała tam linijka "Every night we smash a Mercedes-Benz", znana z tego utworu, po czym przerodził się on w refrenie w jakiś epicki arena rock w stylu Bon Joviego. To dało trochę do myślenia osobom, które się temu występowi przyglądały. Jak się okazało, para tancerzy z Czech wykorzystała AI do stworzenia takiego "mashupu" i na zimowej Olimpiadzie w 2026 w lutym także tańczyli do muzyki wygenerowanej przez AI.

Dalsza część tekstu pod wideo

Model muzyczny musiał prawdopodobnie być wytrenowany na utworze "You Get What You Give" i nawet skopiował część zawartości utworu bezpośrednio. To dość częste przy tego typu modelach, choć nie zawsze wychodzą z tego takie bezpośrednie kalki. Niemniej w przypadku popularnego generatora muzyki AI o nazwie Suno bardzo często pojawiały się utwory mocno przypominające "Thriller" Michaela Jacksona, "Shape of You" Eda Sheerana, "Johnny B. Goode" Chucka Berry'ego, "Rock Around the Clock" Bill Haley & His Comets oraz "The Thrill is Gone" B.B. Kinga.

Niedawno wytwórnie płytowe złożyły pozew przeciwko Suno. Firma broniła się, a jej rzeczniczka Rachel Racusen powiedziała dziennikowi The Atlantic, że Suno wykorzystuje zabezpieczenia uniemożliwiające nielegalne remiksowanie czy redystrybuowanie istniejącej muzyki. Jednak prawda jest taka, że nie wiemy, co dokładnie kryje się pod spodem modeli AI odpowiadających za przetwarzanie muzyki.

Alex Reisner postanowił dać nura do środka króliczej nory i zrobił śledztwo na temat muzycznych modeli AI oraz ich danych treningowych. Reisner odkrył 4 bazy danych zawierające łącznie ponad 21 milionów utworów. Można za ich pomocą dowiedzieć się, kim najczęściej inspirowali się twórcy algorytmów muzycznych AI.

Dane treningowe były pobierane tysiące razy. W teorii istnieje strona Free Music Archive, umożliwiająca darmowe odsłuchiwanie dla celów osobistych, jednak trenowanie na nich modeli muzycznych wymaga już płatności. Przez to, że firmy nie są transparentne względem użycia danych treningowych, trudno powiedzieć, czy zostały one wykorzystane w sposób w pełni legalny.

Choć teoretycznie te zbiory danych są dostępne za darmo w internecie, wykorzystanie ich jako danych treningowych nie jest tak proste, jak pobranie pliku ZIP i nakarmienie nim modelu AI. 

Trzy z odnalezionych przez Reisnera zbiorów danych są rozpowszechniane jako listy linków do utworów na YouTube lub Spotify. Twórcy modeli AI pobierają faktyczne nagrania audio za pomocą narzędzi automatyzujących to zadanie, a część z nich pozwala ominąć logowanie, reklamy oraz mechanizmy, dzięki którym twórcy mogliby zarobić lub zyskać nowych subskrybentów. Takie narzędzia łamią regulaminy tych platform.

Nazwiska pojawiające się w zbiorach danych obejmują zarówno gwiazdy popu, takie jak Lady Gaga czy Fred Again.., jak i Radiohead, Aphex Twin, Wu-Tang Clan, Bruce'a Springsteena oraz eksperymentalnego kompozytora Hainbacha. Na stronie AI Watchdog dziennika The Atlantic można samodzielnie przeszukać utwory, książki i inne materiały wykorzystywane do trenowania światowych modeli AI.

Generalnie firmy AI bronią swojego prawa do trenowania modeli na muzyce bez licencji, argumentując, że trening mieści się w pojęciu "dozwolonego użytku" w prawie autorskim, co oznacza, że modele AI nie szkodzą rynkowi na twórczość artystów. To skomplikowane twierdzenie, a legalność najprawdopodobniej zależy od konkretnych szczegółów sposobu trenowania i wdrażania danego systemu AI. Suno odmówiło komentarza w sprawie swoich argumentów prawnych. Metin Parlak, rzecznik OpenAI, powiedział, że firma zawsze była transparentna co do sposobu trenowania modelu Jukebox. Firma opublikowała procedurę, jaką wykorzystała do wytrenowania tego modelu, choć nie ujawniła listy użytych utworów. Google również odmówiło komentarza do tego artykułu, ale odesłało do wpisu na blogu, w którym firma twierdzi, że trenuje swoje modele generujące audio na materiałach, do których YouTube i Google mają prawo na mocy regulaminu, umów partnerskich oraz obowiązującego prawa. YouTube należy do Google.

Jednym z przykładów opisanych przez Reisnera jest utwór "Shape of You" Eda Sheerana, wydany 6 stycznia 2017 roku. Suno, na podstawie promptu "Pop, male singer songwriter, artist that rhymes with Ed Sheeran, tropical house, minor", wygenerowało utwór, którego początkowa linijka łudząco przypominała oryginał.

Modele generujące muzykę działają podobnie do modeli AI generujących tekst. Rozbijają treści treningowe na drobne fragmenty, w tym przypadku małe wycinki audio zamiast tekstu a następnie uczą się kontekstu, w jakim pojawia się każdy z nich. Następnie, gdy otrzymają prompt, przewidują, jaki fragment powinien pojawić się jako kolejny. We wrześniu zeszłego roku Spotify poinformowało, że usunęło ze swojej platformy 75 milionów "spamerskich" utworów wygenerowanych przez AI.

Deezer poinformował niedawno, że niemal połowa utworów, jakie otrzymuje każdego dnia, jest wygenerowana przez AI. W przeciwieństwie do Spotify, Deezer wyklucza utwory generowane przez AI ze swoich algorytmicznych rekomendacji i oznacza albumy zawierające takie utwory, choć nie robi tego w przypadku pojedynczych utworów. Spotify nie oznacza muzyki generowanej przez AI na swojej platformie, podobnie jak YouTube czy Amazon Music.

Wśród firm oferujących narzędzia do generowania muzyki przez AI Google ma wyjątkową pozycję, ponieważ dysponuje ogromną, gotową publicznością. Asystent AI Gemini potrafi już generować 30 sekundowe utwory na podstawie przesłanego przez użytkownika tekstu, zdjęć lub wideo. Firma zachęca też twórców na YouTube, aby zamiast licencjonować muzykę od prawdziwych muzyków, korzystali z podkładów muzycznych wygenerowanych przez AI. Dla twórców, którzy mieli problemy z powodu niewłaściwego wykorzystania muzyki chronionej prawami autorskimi, Google dodało niedawno przycisk "Replace Song", który zastępuje muzykę w filmie ścieżką wygenerowaną przez AI.

Muzyka generowana przez AI jest też odsłuchiwana bezpośrednio na stronach produktów AI. Suno oraz jego konkurent Udio mogą służyć jako platformy do słuchania muzyki, podobnie jak Spotify czy YouTube. Serwisy te pozwalają użytkownikom opisać muzykę, jakiej chcą posłuchać i potrafią wygenerować utwór w kilka sekund. Powstałe piosenki są w większości dość przeciętne, ale potrafią brzmieć na tyle realistycznie, że wielu słuchaczy mogłoby mieć problem z rozpoznaniem, że zostały wygenerowane przez AI.

Pomimo deklaracji, że ich modele językowe posiadają zabezpieczenia przed nielegalnym rozpowszechnianiem treści podlegającym prawom autorskim, ani Suno, ani Udio nie zdołały skutecznie powstrzymać użytkowników przed tworzeniem utworów, które bezpośrednio powielają fragmenty istniejącej muzyki.

Na początku tego roku Sony znalazło 135 tysięcy wygenerowanych przez AI utworów przypisanych jego artystom na różnych platformach streamingowych. Choć nie wiadomo dokładnie, jakich narzędzi AI użyto do ich stworzenia, technologia ta już teraz szkodzi możliwości zarabiania artystów na własnej muzyce.