Aplikacje

Pogadasz z Google na temat przesłanych nagrań dźwiękowych

Google rozszerza możliwości swojej sztucznej inteligencji Gemini o przetwarzanie i analizę plików audio, co stanowi ważny krok w rozwoju wielomodalnych systemów AI.

DOMINIK KRAWCZYK (DKRAW) 09 WRZ 2025

Pogadasz z Google na temat przesłanych nagrań dźwiękowych

Dodaj do ulubionych źródeł w Google

Nowe możliwości Google Gemini

Dotychczas Gemini umiała generować treści tekstowe, obrazy i wideo oraz tworzyć dźwięki, ale nie pozwalała użytkownikom na przesyłanie własnych plików audio do analizy. Teraz ta bariera została przełamana, dzięki czemu użytkownicy mogą wgrywać nagrania audio i rozmawiać z AI na ich temat.

Dalsza część tekstu pod wideo

Funkcja ta jest dostępna zarówno w aplikacji mobilnej Gemini, jak i jej wersji webowej. Wystarczy w oknie rozmowy kliknąć ikonę „+” i wybrać plik audio, który może mieć do 10 minut długości w wersji darmowej. Użytkownicy wykupujący subskrypcję Gemini AI Pro lub Ultra mogą przesyłać pliki nawet do 3 godzin trwania.

Wybrane okazje dla Ciebie

Reklama

0 zł

~~769.99 zł~~ - najniższa cena

Kup teraz 769.99 zł

0 zł

~~514.87 zł~~ - najniższa cena

Kup teraz 514.87 zł

0 zł

~~469 zł~~ - najniższa cena

Kup teraz 469 zł

Oprócz plików audio, Gemini obsługuje teraz różne formaty, takie jak zestawy plików ZIP, wideo do 2 GB (do 5 minut dla darmowych użytkowników i do 1 godziny dla płacących) oraz foldery z kodem źródłowym i repozytoria GitHub.

To doskonała sprawa dla studentów i twórców cyfrowych

Nowa funkcja bardzo ułatwia pracę z długimi nagraniami, jak wykłady, podcasty czy audiobooki. Użytkownik może szybko uzyskać streszczenia, wyciągnąć kluczowe punkty lub zamienić treść audio na raporty, krótkie notatki czy wizualne slajdy wiedzy — wszystko to według indywidualnych potrzeb. Co więcej, wsparcie dla plików audio nie ogranicza się do języka angielskiego, co znacznie podnosi użyteczność narzędzia na całym świecie.

Warto też przypomnieć, że w ekosystemie Google pojawiło się jakiś czas temu inne ciekawe narzędzie — NotebookLM, które potrafi zamieniać długie pliki tekstowe na podcasty audio w formie dialogu dwóch osób lub przygotować materiał w formie wideo. Google oferuje także darmowy dostęp do wersji Pro Gemini dla studentów w wielu krajach.

Google Google Gemini Gemini z dyktafonu na tekst tłumaczenie nagrań dźwiękowych wykłady na tekst

Źródła zdjęć: Azulblue / Shutterstock

Źródła tekstu: Digital Trends, Google, oprac. wł

Zobacz więcej

Aplikacje 10 LIP 2026

Jakim cudem ten beton był tak twardy? Sekret w rzymskiej latrynie

Będą kary za samą możliwość wyłączenia limitu prędkości hulajnóg

Skąd się wzięły? Nietypowe komety wyjaśnią zagadki Układu Słonecznego

Bezprzewodowo połączysz je z telewizorem. Te głośniki mogą być hitem

Pancerniak z przyciskiem śmierci. Oukitel WP500 Ultra zaskakuje (test)

Tęsknisz za Nintendo DS? Ta konsola jest dla Ciebie

Legalna elektryczna damka. Test Engwe L20 3.0 Boost

Elektryk prosto wyjaśnia, dlaczego modernizacja sieci jest tak ważna

Kontrole fiskusa. Aż w 60% przypadków wykryto nieprawidłowości

Unia bierze się za nasze pieniądze. Poznaliśmy główne założenia

ING właśnie ogłosił. Nowa oferta wystartowała 9 lipca

Pekao nie szczędzi procentów. Nowa oferta jest naprawdę korzystna

3 zmiany, które sprawiają, że "Ród Smoka" jest jeszcze lepszy

Netflix chce na dłużej przykuć nas do ekranu. Ma na to pomysł

Najbardziej przerażający thriller ostatnich lat. 7 odcinków już na platformie

Dżentelmeni wracają i to z wielkim hukiem. Oto zwiastun i data premiery

Pogadasz z Google na temat przesłanych nagrań dźwiękowych

Nowe możliwości Google Gemini

To doskonała sprawa dla studentów i twórców cyfrowych

Zobacz więcej

Polacy korzystają właściwie bez przerwy. Lidl zaciera ręce z radości

Spotify z nową funkcją. Proste rozwiązania cieszą najbardziej

Ta przeglądarka blokuje reklamy na YouTube. Premium bez Premium

Wyszukiwarka

Menu

Nasze strony