Google odpalił Whisk: remiksowanie obrazów z pomocą Gemini i Imagen 3

Google wystartował dziś z nowym, na razie eksperymentalnym projektem o nazwie Whisk, który wykorzystuje generatywną sztuczną inteligencję do jeszcze łatwiejszego tworzenia obrazów.

Mieszko Zagańczyk (Mieszko)
0
Udostępnij na fb
Udostępnij na X
Google odpalił Whisk: remiksowanie obrazów z pomocą Gemini i Imagen 3

Whisk, co w tym kontekście można przetłumaczyć jako „trzepaczka”, to projekt zainicjowany w ramach Google Labs. Na razie dostępny jest tylko dla użytkowników w USA i ma formę eksperymentalną, ale jeżeli się sprawdzi i przyjmie, to Google zdobędzie kolejny atut na rynku rozwijających się rozwiązań AI.

Dalsza część tekstu pod wideo

Whisk: remiksuj swoje obrazy

Na czym polega Google Whisk? Zamiast generować obrazy za pomocą długich, szczegółowych promptów tekstowych, jak jest teraz w Gemini z Imagen 3, Whisk umożliwia wprowadzanie proptów złożonych z obrazów. Wystarczy je tylko przeciągnąć czy dodać z galerii, tworząc niecodzienne kompozycje.

Whisk wykorzystuje trzy elementy do stworzenia własnej kompozycji: obiekt, scenę i styl. Obiekt to „główny bohater” tworzonej treści, gdy pozostałe elementy pozwalają go osadzić w jakimś kontekście. Można na przykład wybrać zdjęcie przedstawiające jakąś osobę jako obiekt, dodać scenę – własny obrazek przedstawiający krajobraz na tło albo wylosować grafikę z galerii – a na koniec zdefiniować styl całej kompozycji, na przykład anime, przy czym tu też się można posłużyć krótkim promptem tekstowym. 

Google odpalił Whisk: remiksowanie obrazów z pomocą Gemini i Imagen 3

W kolejnym etapie można podać dodatkowe szczegóły, na przykład opisać, jak ma się zachowywać obiekt, jak ma być ubrany czy inne tego typu detale. Po chwili Whisk wygeneruje kilka gotowych obrazów, pozostawiając jeszcze opcję dalszej edycji i dodania nowych szczegółów. Za wszystko odpowiada Gemini z generatorem obrazów Imagen 3.

Google odpalił Whisk: remiksowanie obrazów z pomocą Gemini i Imagen 3

Google podkreśla, że Whisk wyodrębnia z wejściowego obrazu tylko kilka kluczowych cech, więc ostateczny efekt zabawy może różnić się od naszych oczekiwań. Różnice mogą dotyczyć takich cech, jak wzrost, waga, fryzura lub odcień skóry – ale tu właśnie jest miejsce na dalszą edycję i dostosowanie obrazu do swojej wizji. W ten sposób łatwo remiksować swoje tematy, sceny i style w dowolny sposób.

 

Podczas wczesnych testów Google, zaangażowani w nie artyści i twórcy opisywali Whisk jako nowy typ narzędzia kreatywnego, a nie tradycyjny edytor obrazów. Całość została zbudowana dla szybkich realizacji wizualnych, a nie szczegółowej edycji z pikselową szczegółowością.

Użytkownicy ze Stanów Zjednoczonych mogą już testować Whisk na stronie labs.google/whisk. Pozostaje nam tylko czekać, aż nowość Google trafi także do nas.