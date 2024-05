To już nie jest wizja z filmów sci-fi. Za chwilę każdy z nas będzie miał w kieszeni prawdziwego asystenta, który do złudzenia przypomina drugiego człowieka.

W ostatnich latach na rynku sztucznej inteligencji wyłoniło się nam dwóch liderów. W przypadku sprzętu jest to NVIDIA wraz ze swoimi akceleratorami. Zaś pod względem oprogramowania królem jest OpenAI z szalenie zaawansowanymi modelami GPT i dostępnym na smartfonach i komputerach ChatGPT.

GPT-4o może na żywo analizować obraz z Twojego aparatu

OpenAI ogłosiło dzisiaj GPT-4o, czyli najnowszy flagowy model LLM, który może analizować dźwięk, obraz i tekst w czasie rzeczywistym. Będzie on stopniowo wprowadzany w najbliższych tygodniach, a dostęp do niego mają mieć zarówno użytkownicy płatni, jak i darmowi.

GPT-4o ("o" od "omni") jest krokiem w kierunku bardziej naturalnej interakcji człowiek-komputer. Może reagować na audio w zaledwie 232 milisekundy, ze średnią 320 milisekund, co jest podobne do czasu reakcji człowieka w rozmowie. Nowy model dorównuje wydajności GPT-4 Turbo w przypadku języku angielskiego, ze znaczną poprawą w przypadku tekstu w językach innych niż angielski.

Jak twierdzi OpenAI, GPT-4o jest znacznie lepsze w zakresie "widzenia" oraz rozumienia dźwięku w porównaniu z istniejącymi modelami. Co więcej API jest o 50% tańsze niż wcześniejsze rozwiązania. W efekcie ChatGPT może zastąpić rozwiązania takie jak Siri od Apple czy Asystent Google.

W śród przytoczonych przykładów użycia pokazano między innymi pomoc w odrabianiu pracy domowej z matematyki, ocenę emocji na twarz użytkownika czy analizę otoczenia w czasie rzeczywistym. Do tego wszystkiego wystarczył smartfon z dostępem do internetu i brak większego obycia z AI.

Chat bot otrzyma również swoistą "Pamięć", czyli tryb umożliwiający dostęp do wcześniejszych zapytań. Tym samym ChatGPT będzie mógł udzielać trafniejszych odpowiedzi, sprawiać wrażenie "bardziej ludzkiego" oraz oferować np. lepsze historie, jeśli ktoś używa go do pomocy w wymyślaniu fabuły czy opowiadań.

Na koniec trzeba powiedzieć, że ChatGPT ma stać się znacznie bardziej dostępny. Wszystko za sprawą klienta dla komputerów stacjonarnych z systemem Windows lub MacOS oraz usprawnień dla aplikacji mobilnych i interfejsu sieciowego. Darmowi użytkownicy dostana też dostęp do sklepu GPT.

OpenAI podziękowało imiennie Jensenowi Huangowi, CEO NVIDII, za przekazanie w kwietniu NVIDIA DGX H200, które napędzało demo na konferencji. Co więcej występowanie produktów Apple na konferencji ożywiło plotki, że gigant z Cupertino i OpenAI mogą ogłosić partnerstwo na czerwcowym WWDC.

