Transkrypcja wiadomości głosowych nadchodzi. Niespodzianka: będzie realizowana nie przez samego WhatsAppa, lecz Apple, który uzyska pełny dostęp do nagrań.

Wiadomości głosowe z jednej strony są bardzo praktyczne, bo pozwalają zaoszczędzić mozolnego klepania w klawiaturę, z drugiej – zdarza się im stanowić problem. Wystarczy sobie wyobrazić próbę odsłuchu w zatłoczonym autobusie. Albo szukasz po kieszeniach słuchawek, albo narażasz swoją prywatność, nie wspominając już o dyskomforcie dla innych pasażerów. Koszmar.

WhatsApp najwyraźniej zdaje sobie sprawę z występujących mankamentów takiej formy komunikacji, bo oto, jak wynika z doniesień serwisu WABetaInfo, pracuje nad funkcją transkrypcji. Idea jest taka, aby wiadomości głosowe, jeszcze przed odsłuchem, były zamieniane na tekst. To znaczy, że nadawca mógłby dalej ułatwiać sobie życie nagrywając wypowiedzi, a odbiorca nie miałby bólu głowy z dyskretnym odczytaniem przekazu. Krótko, wilk syty i owca cała.

Co jednak w tej sprawie najciekawsze, algorytm ma działać po stronie serwera i – tutaj uwaga – nie w infrastrukturze macierzystej, lecz u Apple. To właśnie firma z Cupertino weźmie na siebie ciężar obliczeniowy, przesyłając użytkownikowi gotową już wiadomość. Przy czym niejako w zamian za to otrzyma materiały audio do karmienia swych modeli rozpoznawania mowy.

Niemniej z tego też względu nie wiadomo, czy transkrypcja, przynajmniej w swojej początkowej fazie, nie będzie zarezerwowana wyłącznie dla iOS. Na razie development odbywa się tylko na iPhonie i pokrewnych, a Apple, delikatnie mówiąc, raczej nie słynie z udostępniania swych rozwiązań firmom trzecim.

Tak czy inaczej, trzeba przyznać, pomysł brzmi bardzo rozsądnie. Pytanie, co z bezpieczeństwem i prywatnością konwersacji. Jak zapewnia źródło, ani WhatsApp, ani Apple rozmów w formie tekstowej gromadzić nie będą. Ale równocześnie wiemy, że zapał Apple do przetwarzania nagrań ma drugie dno.

Źródło zdjęć: Unsplash (Dimitri Karastelev)

Źródło tekstu: WABetaInfo, oprac. własne