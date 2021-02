Czy telefon nasłuchuje, żeby wysyłać Ci lepsze reklamy? Nie, to mit. Przynajmniej na razie. Spotify planuje z tego, co i jak mówimy, określać wiek, płeć i nastrój, by lepiej dopasować muzykę.

Nawet bez podsłuchiwania naszych rozmów reklamy, które trafiają do nas podczas przeglądania stron internetowych, są podejrzanie trafione. Spotify chce iść o krok dalej i poznawać nie tylko demografię użytkowników, ale też cechy osobowości i chwilowy stan emocjonalny. Spotify sugeruje, że może proponować spersonalizowane treści (mogą to być zarówno reklamy, jak i playlisty i podcasty) na bazie cech użytkownika, a tych domyśli się z głosu.

Aktualnie Spotify (i podobne usługi) uczą się gustu użytkowników przez zadawanie pytań, a potem podsuwanie mediów podobnych do już polubionych i unikanie tych nielubianych. Ten proces jest jednak żmudny i z punktu widzenia użytkownika uciążliwy na świeżo założonym koncie. Nie ma nic pasjonującego w wybieraniu, kogo ewentualnie bym posłuchała, z listy losowo wybranych artystów, których większości nawet nie znam i chyba poznać nie mam ochoty.

Na pomoc ma przyjść rozpoznawanie mowy. Podobno sposób mówienia i barwa głosu mają zdradzić kim jestem, jak się czuję, ile mam lat i tak dalej. Innymi słowy, dostarczymy aplikacji sygnał audio, zawierający głos i dźwięki otoczenia, wydając polecenie głosowe.

Analiza tych danych (intonacji, rytmu, akcentów i tym podobnych cech mowy) w połączeniu z informacjami akustycznymi po analizie probabilistycznej (w patencie mowa o ukrytym modelu Markowa) ma zebrać metadane o próbce dźwiękowej. One z kolei pozwolą przypisać nastrój użytkownika do jednej z kategorii. Posłużyć do tego może na przykład drzewiasty schemat podziału emocji Parrotta, ale pewnie skończy się na czymś znacznie prostszym.

Po tym zabiegu Spotify zajrzy także do swoich normalnych źródeł – do historii słuchania, polubionych albumów i obserwowanych wykonawców, a w końcu także na profile znajomych, by dobrać jak najlepszą muzykę do aktualnego nastroju. Wszystko to będzie musiało stać się w ciągu sekundy, bo kto by dłużej czekał na muzykę z apki?

Opis techniki analizy głosu brzmi bardzo ciekawie i obiecująco, ale widzę kilka wad. Po pierwsze, już teraz czuję, że Spotify zamyka mnie w pewnej „bańce” muzycznej, z której muszę się o własnych siłach wyrywać. Obawiam się, że ten mechanizm nie pomoże.

To jednak błahostka w porównaniu do potencjalnych naruszeń prywatności. Dość wspomnieć, że firma pracuje także nad geotagowanymi reklamami, dostarczanymi zależnie od położenia użytkownika. Przy okazji analizy dźwięków Spotify może wnioskować, kiedy słucham muzyki w parku, czy bardziej się cieszę jadąc do Warszawy czy z Warszawy i czy się denerwuję, gdy słyszę rozmowę innych osób.

Nawet jeśli Spotify tylko eksperymentuje (w końcu od patentu do produktu prowadzi długa droga), w końcu powstanie asystent głosowy zdolny rozpoznawać emocje użytkownika i sytuację, w której się znajduje. Myślę, że to tylko kwestia czasu.

