ChatGPT poprawi kluczową kwestię. Ale to nie koniec zmian

Lider na rynku sztucznej inteligencji od dłuższego czasu pracuje w tajemnicy nad usprawnieniem swoich modeli dźwiękowych. Będą one wspierać zarówno popularnego czatbota, jak i planowane na najbliższe lata urządzenia.

Przemysław Banasiak (Yokai)
1
Udostępnij na fb
Udostępnij na X
ChatGPT poprawi kluczową kwestię. Ale to nie koniec zmian

OpenAI wyraźnie stawia na dźwięk i nie chodzi wyłącznie o to, by ChatGPT brzmiał bardziej naturalnie. Z najnowszych doniesień wynika, że w ostatnich dwóch miesiącach firma połączyła kilka zespołów inżynieryjnych, produktowych i badawczych. Cel jest jeden - gruntowna przebudowa modeli audio, która ma przygotować grunt pod premierę osobistego urządzenia zorientowanego przede wszystkim na komunikację głosową.

Dalsza część tekstu pod wideo

Inteligentne głośniki, okulary, długopisy, pierścionki i wiele więcej

Nowy model audio OpenAI, którego premiera ma nastąpić w pierwszym kwartale 2026 roku, ma brzmieć znacznie bardziej naturalnie, radzić sobie z przerywaniem wypowiedzi i prowadzić rozmowę w sposób bliższy prawdziwemu dialogowi. Według przecieków będzie nawet potrafił mówić równocześnie z użytkownikiem, czego obecne modele nie oferują. Firma ma też myśleć o całej rodzinie urządzeń, które mają zachowywać się mniej jak narzędzia, a bardziej jak cyfrowi towarzysze.

To ruch wpisujący się w szerszy trend widoczny w całej branży. Ekrany powoli schodzą na dalszy plan, a dźwięk staje się głównym interfejsem kontaktu z technologią. Inteligentne głośniki już teraz zadomowiły się w ponad ⅓ amerykańskich gospodarstw domowych. A to dopiero początek.

Meta niedawno wprowadziła nową funkcję do inteligentnych okularów Ray-Ban, wykorzystującą zestaw 5 mikrofonów do lepszego wyłapywania rozmów w hałaśliwym otoczeniu. Google testuje tzw. Audio Overviews, które zamieniają wyniki wyszukiwania w konwersacyjne podsumowania, a Tesla integruje w swoich autach AI, tworząc asystenta głosowego obsługującego nawigację, klimatyzację i inne funkcje auta w naturalnym dialogu.

Na rynku pojawiło się też wiele startupów z podobną wizją, choć ich losy bywają różne. AI Pin pochłonął setki milionów dolarów, by ostatecznie stać się przykładem nietrafionego, bezekranowego gadżetu. Z kolei Friend AI, reklamowany jako cyfrowy towarzysz zapisujący codzienne życie użytkownika, wzbudza jednocześnie fascynację i obawy o prywatność.

Na horyzoncie są też kolejne eksperymenty - co najmniej dwie firmy, w tym Sandbar oraz spółka kierowana przez Erica Migicovsky’ego, twórcę Pebble, pracują nad inteligentnymi pierścieniami AI. Ich debiut planowany jest na 2026 rok, a idea polega na tym, by dosłownie rozmawiać z dłonią.

Choć formy urządzeń są różne, założenie pozostaje takie samo. Dźwięk ma stać się podstawowym sposobem interakcji z technologią, a każda przestrzeń - dom, samochód, biuro - zamienia się w interfejs sterowania.