Nowość w Google Gemini. AI tworzy muzykę ze zdjęcia

Google rozbudowuje funkcje swojej sztucznej inteligencji Gemini o generowanie dźwięku. Użytkownicy mogą tworzyć własne piosenki.

Marian Szutiak (msnet)
0
Udostępnij na fb
Udostępnij na X
Nowość w Google Gemini. AI tworzy muzykę ze zdjęcia

Nowy model dźwiękowy od DeepMind

Za nową funkcję odpowiada model Lyria 3. Został on stworzony przez zespół Google DeepMind. Opcja ta jest już dostępna w aplikacji Gemini dla wszystkich użytkowników na całym świecie. Obsługuje ona również wszystkie języki obsługiwane przez Gemini.

Dalsza część tekstu pod wideo

Narzędzie pozwala na zmianę prostych opisów w gotowe nagrania. Wymaga to wpisania wybranego gatunku muzycznego lub nastroju. System potrafi wygenerować zarówno ścieżki instrumentalne, jak i utwory z wokalem.

Lyria 3 przetwarza także wgrywane pliki. Użytkownik może dodać do aplikacji zdjęcie, dokument tekstowy, plik PDF lub slajd z prezentacji. Sztuczna inteligencja analizuje ich zawartość. Następnie system układa pasujący tekst piosenki i komponuje utwór.

Pół minuty muzyki i opcja dla twórców wideo

Aplikacja tworzy utwory o długości 30 sekund. Otrzymują one unikalne okładki, za które odpowiada generator obrazów Nano Banana. Gotowe nagranie można pobrać do pamięci urządzenia lub udostępnić znajomym za pomocą linku.

Google udostępnia ten sam model twórcom na platformie YouTube. Funkcja o nazwie Dream Track trafia do osób spoza Stanów Zjednoczonych. Ułatwia ona tworzenie podkładów dźwiękowych do krótkich filmów w sekcji Shorts.

Trzecia generacja modelu Lyria wprowadza kilka zmian. System samodzielnie generuje słowa piosenek. Użytkownik otrzymuje kontrolę nad tempem utworu, stylem wokalu i brzmieniem. Kompozycje zyskały wyższą jakość niż w poprzednich wersjach testowych.

Nowość w Google Gemini. AI tworzy muzykę ze zdjęcia

Znaki wodne i ochrona praw autorskich

Wszystkie wygenerowane nagrania zawierają wbudowany znak wodny SynthID. Jest on niesłyszalny dla ludzkiego ucha. Aplikacja Gemini zyskała funkcję weryfikacji takich plików. Po wgraniu pliku audio sztuczna inteligencja sprawdza obecność znaku i określa jego pochodzenie.

Twórcy algorytmu wdrożyli blokady chroniące prawa autorskie. System zapobiega kopiowaniu stylu znanych artystów. Wpisanie nazwiska muzyka w poleceniu sprawia, że algorytm traktuje je tylko jako punkt odniesienia do stworzenia czegoś nowego.

Firma udostępniła narzędzia do zgłaszania naruszeń praw autorskich i prywatności. Użytkownicy łamiący regulamin usługi mogą ponieść konsekwencje. Przedstawiciele firmy Google zaznaczają, że ich narzędzie nie zastąpi prawdziwych artystów, a ma służyć jedynie jako dodatkowa forma ekspresji.

Google Pixel 10a