Google odpalił Whisk: remiksowanie obrazów z pomocą Gemini i Imagen 3
Google wystartował dziś z nowym, na razie eksperymentalnym projektem o nazwie Whisk, który wykorzystuje generatywną sztuczną inteligencję do jeszcze łatwiejszego tworzenia obrazów.

Whisk, co w tym kontekście można przetłumaczyć jako „trzepaczka”, to projekt zainicjowany w ramach Google Labs. Na razie dostępny jest tylko dla użytkowników w USA i ma formę eksperymentalną, ale jeżeli się sprawdzi i przyjmie, to Google zdobędzie kolejny atut na rynku rozwijających się rozwiązań AI.
Whisk: remiksuj swoje obrazy
Na czym polega Google Whisk? Zamiast generować obrazy za pomocą długich, szczegółowych promptów tekstowych, jak jest teraz w Gemini z Imagen 3, Whisk umożliwia wprowadzanie proptów złożonych z obrazów. Wystarczy je tylko przeciągnąć czy dodać z galerii, tworząc niecodzienne kompozycje.


![Monitor VIEWSONIC VX2718-2KPC-MHDJ 27" 2560x1440px 180Hz 1 ms [MPRT] Curved](https://www.mediaexpert.pl/media/cache/resolve/gallery_xml/images/60/6047856/Monitor-VIEWSONIC-VX2718-2KPC-MHDJ.jpg)
Whisk wykorzystuje trzy elementy do stworzenia własnej kompozycji: obiekt, scenę i styl. Obiekt to „główny bohater” tworzonej treści, gdy pozostałe elementy pozwalają go osadzić w jakimś kontekście. Można na przykład wybrać zdjęcie przedstawiające jakąś osobę jako obiekt, dodać scenę – własny obrazek przedstawiający krajobraz na tło albo wylosować grafikę z galerii – a na koniec zdefiniować styl całej kompozycji, na przykład anime, przy czym tu też się można posłużyć krótkim promptem tekstowym.
W kolejnym etapie można podać dodatkowe szczegóły, na przykład opisać, jak ma się zachowywać obiekt, jak ma być ubrany czy inne tego typu detale. Po chwili Whisk wygeneruje kilka gotowych obrazów, pozostawiając jeszcze opcję dalszej edycji i dodania nowych szczegółów. Za wszystko odpowiada Gemini z generatorem obrazów Imagen 3.
Google podkreśla, że Whisk wyodrębnia z wejściowego obrazu tylko kilka kluczowych cech, więc ostateczny efekt zabawy może różnić się od naszych oczekiwań. Różnice mogą dotyczyć takich cech, jak wzrost, waga, fryzura lub odcień skóry – ale tu właśnie jest miejsce na dalszą edycję i dostosowanie obrazu do swojej wizji. W ten sposób łatwo remiksować swoje tematy, sceny i style w dowolny sposób.
Podczas wczesnych testów Google, zaangażowani w nie artyści i twórcy opisywali Whisk jako nowy typ narzędzia kreatywnego, a nie tradycyjny edytor obrazów. Całość została zbudowana dla szybkich realizacji wizualnych, a nie szczegółowej edycji z pikselową szczegółowością.
Użytkownicy ze Stanów Zjednoczonych mogą już testować Whisk na stronie labs.google/whisk. Pozostaje nam tylko czekać, aż nowość Google trafi także do nas.