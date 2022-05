Xiaomi przedstawiło projekt Own My Voice, który umożliwia zastąpienie monotonnych i syntezowanych elektronicznie dźwięków naturalnym głosem. Wszystko po to, by pomóc osobom z zaburzeniami mowy.

Firma Xiaomi zaprezentowała najnowsze zastosowanie algorytmów sztucznej inteligencji w samodzielnie opracowanej technologii syntezy mowy. Opracowane przez Xiaomi AI Lab rozwiązanie Text-To-Speech, będące częścią projektu badawczego „Own My Voice”, jest używane do generowania unikalnego brzmienia głosu dla osób z zaburzeniami mowy. Dzięki temu mogą się one komunikować za pomocą indywidualnego „własnego głosu”, zamiast syntezowanych elektronicznie, monotonnych dźwięków. To zdecydowanie może poprawić komfort życia osób mających problemy z mówieniem

Sposób realizacji projektu

W celu stworzenia możliwie najbardziej spersonalizowanych głosów dla osób z zaburzeniami mowy, zespół Xiaomi zaangażował w projekt ponad 200 ochotników, których próbki mowy zarejestrowano i przeanalizowano na potrzeby projektu. Następnie specjalne algorytmy dopasowały nagrane treści do mowy użytkownika. Dzięki temu udało się ustalić najbardziej odpowiednie brzmienie jako głos referencyjny dla danej osoby z zaburzeniami mowy. Wybrane rzeczywiste głosy zostały poddane złożonej modyfikacji akustycznej, aby uzyskać nowe, oryginalne brzmienie. To ukłon w kierunku ochrony prywatności „dawców głosu”.

Kolejnym krokiem było użycie technologii spontanicznej konwersji tekstu na mowę (Text-To-Speech) do wytrenowania modelu sztucznej inteligencji. Wszystko po to, by nowy głos nabrał naturalnego rytmu i intonacji, co pozwala wiernie wyrazić emocje i ton mowy człowieka.

Znaczenie i waga projektu

Trzonem tego projektu jest grupa ekspertów w dziedzinie technologii mowy z Xiaomi AI Lab. Od 2017 roku opublikowali oni 37 prac na temat mowy, wygłoszonych podczas wielu międzynarodowych konferencji, takich jak International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Sukces aplikacji „Own My Voice” zależy od opracowanej przez nich unikalnej technologii Text-To-Speech.

Technologia zamiany tekstu na mowę metodą spontaniczną upodabnia syntezowany głos do prawdziwej ludzkiej mowy w zakresie intonacji, pauz, szybkości i innych cech. Zastępuje to monotonne i nienaturalne brzmienie głosu elektronicznego. Technologia ta jest już stosowana w wielu inteligentnych urządzeniach Xiaomi wyposażonych w funkcję asystenta głosowego. Projekt „Own My Voice” pokazuje, że synteza mowy Text-To-Speech może być również szeroko stosowana w przełamywaniu barier niepełnosprawności i poprawie komfortu życia.

Jeżeli zauważymy i uwzględnimy tego typu potrzeby na wczesnym etapie, proces upowszechniania innowacji można znacznie skrócić, a korzyści, które z nich płyną, mogą być szybciej dostępne dla potrzebujących tego osób.

– powiedział Zhu Xi, koordynator projektu Tech for Good w Komitecie Technicznym Xiaomi

Zobacz: Xiaomi pokaże Redmi Note 11T w przyszłym tygodniu

Zobacz: Kosmiczne przeceny w Xiaomi. Ceny smartfonów niższe nawet o 1000 zł

Google News Chcesz być na bieżąco? Obserwuj nas na

Źródło zdjęć: Shutterstock, Xiaomi

Źródło tekstu: Xiaomi