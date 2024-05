Android staje się bardziej inteligentny. Na konferencji Google I/O gigant z Mountain View pokazał nowe funkcje swojego systemu mobilnego, ułatwiające nam codzienne życie dzięki AI. Model Gemini doczekał się kolejnych usprawnień, które jeszcze w tym roku trafią na pierwsze smartfony.

Gemini dla Androida to rozwijany przez Google asystent wykorzystujący generatywną sztuczną inteligencję – wcześniej znany jako Bard. Docelowo Gemini ma być domyślnym asystentem w smartfonach z Androidem. Pierwszy wersja Gemini została wydana w lutym, a teraz Google podczas konferencji I/O pochwalił się kolejnymi usprawniani.

Gemini przeszuka za ciebie film na YouTube

Nowością w Gemini jest ulepszony sposób interakcji z użytkownikiem. Okienko Gemini będzie można wyświetlić nad używaną aktualnie aplikacją, bez zajmowania całego ekranu. Sposobów na zapytanie o coś Gemini będzie kilka. Na przykład podczas oglądania wideo na YouTube będzie można przeciągnięciem uruchomić Gemini z poleceniem „Zapytaj ten film” („Ask this video”), dzięki czemu asystent znajdzie konkretne informacje w odtwarzanym wideo. W podobny sposób w Gemini w wersji Advanced będzie można „zapytać PDF” („Ask this PDF”), aby szybko uzyskać odpowiedzi bez konieczności przewijania wielu stron w rozbudowanym dokumencie PDF.

Przeciąganie i upuszczanie sprawdzi się także w innych scenariuszach. Użytkownik będzie mógł poprosić Gemini o wygenerowanie obrazu, a gdy już powstanie – przeciągnąć i upuścić do Gmaila lub Wiadomości, by wysłać znajomemu.

Google przekonuje, że Gemini będzie uczyć się sposobów korzystania z różnych aplikacji przez użytkownika smartfonu i w razie potrzeby kontekstowo podsunie różne opcje za pomocą dynamicznych sugestii.

Z zapowiedzi giganta z Mountain View wynika, że aktualizacja Gemini z nowymi sposobami interakcji zostanie wprowadzona na setki milionów urządzeń w ciągu najbliższych kilku miesięcy.

Ulepszone Circle to Search

Funkcja „Zakreśl, aby wyszukać” (Circle to Search) znana jest już telefonów Galaxy i Pixel, ale Google dalej wprowadza do niej nowe zastosowania. Nowością jest pomoc w nauce – uczeń lub student nie tylko uzyska odpowiedź na pytanie, ale w razie potrzeby otrzyma bardziej rozbudowaną pomoc w nauce, tak by mógł też zrozumieć problem. Jeżeli uczeń utknie nad rozwiązaniem jakiegoś zadania z fizyki lub matematyki, po zakreśleniu na smartfonie czy tablecie wybranej treści otrzyma instrukcje krok po kroku dotyczące rozwiązania, bez opuszczania aplikacji.

Google zapowiada, że jeszcze w tym roku Circle to Search będzie w stanie pomóc w rozwiązaniu bardziej złożonych zadań, obejmujących obliczenia symboliczne, diagramy, wykresy itp. Wszystkie te ułatwienia są możliwe dzięki wykorzystaniu modelu sztucznej inteligencji LearnLM.

Multimodalny Gemini Nano

Google rozbudował także Gemini Nano, czyli model sztucznej inteligencji stworzony z myślą o zastosowaniach w smartfonach z Androidem – na początek rozwijany dla serii Pixel. Ideą Gemini Nano jest możliwość wykonywania różnych operacji bezpośrednio na urządzeniu, bez konieczności połączenia z siecią, z zachowaniem dużej dbałości o bezpieczeństwo. Teraz Gemini Nano staje się multimodalny, dzięki czemu telefon będzie mógł nie tylko przetwarzać tekst, ale także płynnie analizować zdjęcia, wideo czy polecenia głosowe i w ten sposób odpowiadać na różne pytania, czy wykonywać polecenia.

Funkcja „Gemini Nano with Multimodality” zadebiutuje jeszcze w tym roku w smartfonach Google Pixel.

Jak zapowiada Google, multimodalne możliwości Gemini Nano pojawią się w też w TalkBack, czyli funkcji ułatwiającej korzystanie ze smartfonu osobom niewidomym lub słabowidzącym. Gemini Nano pozwoli skuteczniej rozpoznawać to, co znajduje się na zdjęciach. Google podaje, że obecnie użytkownicy TalkBack natrafiają na 90 nieoznaczonych obrazów dziennie. Usprawnienie w Gemini Nano podpowie im na przykład, co jest na zdjęciu przesłanym przez rodzinę lub przyjaciół, czy też o styl i krój ubrań podczas zakupów online.

Gemini Nano obroni Cię przed telefonicznym spamem

Gogle chce też zwiększyć bezpieczeństwo użytkowników podczas rozmów telefonicznych. Gemini Nano ma zapobiegać próbom wyłudzeń czy oszustw – będzie w czasie rzeczywistym ostrzegać użytkownika podczas rozmowy głosowej, jeżeli wykryje wzorce wykorzystywane przez przestępców.

Gamini Nano będzie ostrzegać na przykład, gdy rozmówca podający się za pracownika banku poprosi o pilne przelanie środków lub będzie chciał, by mu podać dane dostępowe jak kod PIN lub hasło.

Zobacz: Asystent lepszy niż Siri. Nadchodzi nowa generacja botów

Zobacz: Gmail czeka trzęsienie ziemi. Zacznie się w lipcu

Google News Chcesz być na bieżąco? Obserwuj nas na

Źródło zdjęć: Shutterstock, Google

Źródło tekstu: Google, opracowanie własne