Google z oczekiwaną nowością. Wystarczy zdjęcie, resztę zrobi Veo 3
Google wprowadził do Gemini nową, długo wyczekiwaną funkcję: zamianę zdjęć na krótkie klipy wideo z dźwiękiem. Rozwiązanie bazuje na modelu generowania wideo Veo 3 i jest dostępne dla użytkowników subskrypcji Google AI Pro i Ultra.

Dzięki nowej funkcji Veo 3 w Gemini użytkownicy mogą przekształcić swoje ulubione zdjęcia w dynamiczne, ośmiosekundowe klipy wideo z dźwiękiem. Google zaczął już wdrażać tę nowość subskrybentom Google AI Pro i Ultra w wybranych krajach na całym świecie. Te same możliwości są również dostępne we Flow, narzędziu Google do tworzenia filmów z pomocą sztucznej inteligencji. Google zapowiada dalsze rozszerzanie dostępności tej funkcji.
Aby skorzystać z funkcji zamiany zdjęcia na wideo, należy wybrać opcję Filmy z menu narzędzi Gemini w polu promptu i przesłać zdjęcie. Następnie trzeba opisać scenę i dodać instrukcje dotyczące ścieżki dźwiękowej (np. efekty, dialogi, tło), a później pozostaje już tylko obserwować, jak statyczny obraz przekształca się w dynamiczny film. Gemini generuje dynamiczny, ośmiosekundowy klip wideo w formacie 16:9 i rozdzielczości 720p, zsynchronizowany z opisem i dźwiękiem. Gotowy film można pobrać lub udostępnić znajomym i rodzinie.



Google podaje, że dzięki nowej funkcji możliwe jest ożywianie zdjęć przedmiotów codziennego użytku, nadawanie ruchu krajobrazom i zdjęciom przyrody czy też tworzenie krótkich animacji na bazie własnych ilustracji.
Każdy wygenerowany klip ma widoczny znak wodny oraz niewidoczny cyfrowy znak wodny SynthID, co pozwala łatwo odróżnić materiały stworzone przez AI. Pozwala to uniknąć tworzenia fejków.
Możliwość przetwarzania zdjęć na filmy nie jest nowością w świecie AI, a podobne funkcje oferuje już wiele serwisów. Można je też bezpłatnie tworzyć w Google AI Studio, za pomocą starszego modelu generowania wideo Veo 2. Jednak Google Veo 3 robi szczególne wrażenie swoimi możliwościami i pozwala na osiągnięcie bardziej realistycznych scen ze ścieżką dźwiękową. Pozostaje mieć nadzieję, że nowa funkcja zostanie udostępniona także w opcji podstawowej Gemini.