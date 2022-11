Firmy typu Call Center coraz częściej posługują się automatami, które są w stanie dokonać transkrypcji wypowiedzi klienta, lecz nie zważają na nacechowanie emocjonalne. Teraz sztuczna inteligencja będzie w stanie wykryć i wyodrębnić emocje w ludzkim głosie.

Myślę, że już większość Polaków miała do czynienia z sytuacją, w której odbierają połączenie, a z drugiej strony słuchawki odzywa się automat. Niezależnie od tego, co wtedy powiemy ani w jakim tonie, wszystko zostanie odebrane dosłownie. Jednak już wkrótce może się to zmienić. Właśnie zebrano pieniądze na opracowanie sztucznej inteligencji, która wykryje emocje w głosie rozmówcy.

Deepgram - rewolucja w obsłudze klienta

W 2015 roku powstał startup Deepgram, założony przez Scotta Stephensona, pracującego wcześniej przy budowie detektorów będących w stanie wykryć czarną materię głęboko pod powierzchnią Ziemi na podstawie dźwięków. Deepgram od początku ma przedstawiać nowatorskie podejście do sztucznej inteligencji. Planem Stephensona jest stworzenie naturalnego procesowania języka (NLP), które będzie mogło nie tylko zrozumieć semantykę wypowiedzi, lecz również ich emocjonalną konotację na podstawie analizy audio. W tym celu udało im się zebrać 47 milionów dolarów.

Deepgram tworzony jest z wykorzystaniem nowoczesnych technik uczenia maszynowego takich jak konwolucyjne sieci neuronowe (CNN), rekurencyjne sieci neuronowe (RNN), czy nowatorskie transformery. Modele, z których korzysta Deepgram są trenowane na falach dźwiękowych, by być w stanie wyciągnąć znaczenie ze słowa mówionego i nie chodzi wyłącznie o to dosłowne.

Co więcej, program został stworzony w taki sposób, że poddaje się samonadzorowaniu przez co ulepsza swoje modele NLP w miarę upływu czasu, co pozwala na coraz lepszą klasyfikację wypowiedzi rozmówcy. Chociaż algorytmy coraz lepiej radzą sobie z wodrębnieniem emocji i są w stanie stwierdzić, czy rozmówca mówi np. w złości, tak użycie sarkazmu nadal je przerasta. Stephenson zaznacza, że sprawienie, by Deepgram był w stanie wykryć i zrozumieć sarkazm, to zadanie na najbliższych pięć lat.

Twórcy projektu nie ukrywają, że zapotrzebowanie na ich technologię znajduje się w dużych firmach z obszernymi działami obsługi klienta, gdzie program mógłby obsługiwać wielu klientów jednocześnie.

Źródło zdjęć: Shutterstock

Źródło tekstu: Venture Beat