Generowanie obrazów za pomocą ulepszonego modelu Imagen 3 jest już dostępne dla wszystkich użytkowników Gemini na całym świecie.
Twórcy Google Gemini ogłosili dziś zapowiadaną już wcześniej zmianę – we wszystkich wersjach Gemini i na całym świecie będzie teraz można korzystać z najbardziej wydajnego i dokładnego modelu generowania obrazu, Imagen 3.
Image generation with Imagen 3 is now available to all Gemini users around the world.
— Google Gemini App (@GeminiApp) October 9, 2024
Imagen 3 is our highest quality image generation model yet and brings an even higher degree of photorealism, better instruction following, and fewer distracting artifacts than ever before. pic.twitter.com/E8CrcyFcz5
Model Imagen 3 został ogłoszony przez Google w sierpniu, wtedy jednak nowa funkcja miała trafić w pierwszej kolejności do płatnych Gemini Advanced, Business i Enterprise w języku angielskim. Jak wynika z dzisiejszej zapowiedzi, teraz o zaletach nowego modelu przekonają się także użytkownicy podstawowego wariantu Gemini.
Google zachwala Imagen 3 jako swój najdoskonalszy model generowania obrazu. Zapewnia jeszcze wyższy stopień fotorealizmu, lepsze wykonywanie instrukcji i tworzy mniej rozpraszających artefaktów niż kiedykolwiek wcześniej.
Imagen 3 generuje obrazy na podstawie zaledwie kilku słów. Można poprosić Gemini o stworzenie obrazów w różnych stylach — np. fotorealistycznego krajobrazu, teksturowanego obrazu olejnego czy fantazyjnej sceny w stylu animacji plastelinowej.
Porównanie jakości obrazu generowanego przez Imagen 2 a Imagen 3 przedstawia powyższa grafika powstała na podstawie promptu:
Wygeneruj obraz połyskujących kropelek rosy na aksamitnym płatku czerwonej róży. Uchwyć skomplikowane szczegóły kropelek wody odbijających poranne promienie słońca oraz delikatne żyłki na płatku.
Różnica jest kolosalna i widać ją na pierwszy rzut oka. Wciąż jednak istnieją pewne ograniczenia – w darmowym Gemini nie można generować obrazów przedstawiających ludzi. Jest to na razie funkcja eksperymentalna w Gemini Advanced, Business i Enterprise. Jednocześnie nawet w tych planach Imagen 3 nie pozwoli na generowanie fotorealistycznych twarzy rozpoznawalnych osób, obrazów przedstawiających osoby małoletnie ani krwawych, brutalnych czy seksualnych scen.
Imagen 3 używa SynthID, narzędzia Google do znakowania wodnego obrazów generowanych przez AI. Dzięki temu zmniejsza się możliwość nadużyć z wykorzystaniem AI.
Zobacz: Zdjęcia Google wykryją obrazy generowane przez AI
Zobacz: Google zmienia aplikację Gemini. Sprawdź, czy masz nowości
Źródło zdjęć: Shutterstock, Google
Źródło tekstu: Google, opracowanie własne