Przyszłość jak z Matrixa, ale na razie tylko dla wybranych
Świat filmów kinowych oraz gier wideo może czekać duża zmiana. Google pokazało, że wystarczy krótki opis by wygenerować wymarzony scenariusz.

Google DeepMind ogłosiło premierę nowej wersji swojego modelu sztucznej inteligencji - Genie 3. To najnowsze podejście do tzw. world models, czyli systemów AI zdolnych do symulowania środowisk 3D, z którymi mogą wchodzić w interakcje zarówno użytkownicy, jak i inne modele AI.
Nadal występują problemy, np. z czytelnym tekstem
W odróżnieniu od wcześniejszych wersji, Genie 3 oferuje znacznie dłuższy czas interakcji - nawet kilka minut ciągłego działania - oraz zdolność do zapamiętywania pozycji obiektów w świecie, nawet gdy użytkownik odwróci od nich wzrok. Modele tego typu znajdują zastosowanie m.in. w edukacji, rozrywce, czy szkoleniu robotów.



Wygenerowane środowiska przypominają gry wideo, jednak zamiast ręcznie tworzonych modeli 3D, całe otoczenie powstaje na podstawie prostego polecenia tekstowego. Co ciekawe nad nową generacją modelu czuwa zespół kierowany przez byłego współtwórcę Sora - narzędzia do generowania wideo rozwijanego przez OpenAI, twórców m.in. ChatGPT.
Genie 3 stanowi wyraźny krok naprzód - umożliwia płynne poruszanie się po generowanych przestrzeniach w rozdzielczości 720p i 24 FPS. Co więcej, system potrafi zapamiętywać wygląd otoczenia nawet przez minutę, dzięki czemu np. napis na tablicy lub kolor ściany nie znikają po odwróceniu wzroku. Dla porównania Genie 2 umożliwiał jedynie 10-20 sekund interakcji w świecie, w którym otoczenie zmieniało się w nieprzewidywalny sposób.
Nowością są też tzw. "promptable world events" - zdarzenia w świecie, które można wywołać poleceniem tekstowym. Użytkownik może np. zmienić pogodę albo wprowadzić nowe postacie do otoczenia. Wszystko to przybliża wizję dynamicznych, w pełni generatywnych światów reagujących na działania użytkownika w czasie rzeczywistym.
Mimo imponujących możliwości, Genie 3 nie będzie jeszcze dostępny publicznie. Google udostępnia go jedynie w ramach ograniczonego programu badawczego dla wybranej grupy naukowców i twórców. Celem tego etapu jest lepsze zrozumienie potencjalnych zagrożeń i sposobów ich ograniczania. Google zapowiada, że planuje rozszerzyć dostępność na kolejnych testerów w przyszłości.