Gemini Przekształcił moje skomplikowane badania w podcast: Nigdy więcej nie będę cierpieć

Przejście z Asystenta Google do Ery Gemini, niemal w końcowej fazie. Można odczuwać nostalgię za wirtualnym asystentem o tej samej nazwie, ale nie da się zaprzeczyć, że pojawienie się Gemini naprawdę zmieniło to, co może dla nas zrobić agent AI.

Zdolności rozumienia języka są znacznie lepsze z Gemini. Rozmowy są naturalne, interakcje z aplikacjami płynne, a integracja z innymi produktami Google jest satysfakcjonująca. Nawet w stanie wolnymGemini przewyższa Siri nawet na iPhonie.

Istnieją jednak pewne sztuczki, które umieszczają Bliźnięta w zupełnie innej kategorii. Głębokie badania To jedna z tych funkcji proxy, z których korzystam codziennie i które wciąż mnie zadziwiają. W marcu Google dodało kolejną satysfakcjonującą funkcję do arsenału Gemini: Podglądy audio.

Zamień wszystko w podcast

Monit o zapoznanie się z treścią audio w Gemini.

Wyobraź sobie, że zamieniasz nudne dokumenty, niezwykle skomplikowaną pracę badawczą lub materiały akademickie w żywą, dwustronną konwersację w podcaście. Właśnie o to chodzi w Audio Briefings. Funkcja ta pojawiła się po raz pierwszy w mocno krytykowanym NotebookLM od Google, a w końcu została przeniesiona do podstawowego środowiska Gemini na urządzeniach mobilnych i w internecie.

Nie musisz przechodzić przez żadne procedury techniczne ani pisać bardzo szczegółowego skryptu, aby uzyskać te edycje audio. Wystarczy przesłać plik z selektora załączników, a slajd „Utwórz kanał audio” pojawi się tuż nad polem czatu. Kliknij go, a Twój podcast się rozpocznie.

Może to potrwać kilka minut, ale w międzyczasie możesz bezpiecznie przełączyć się na inną aplikację (lub okno). Po zakończeniu procesu otrzymasz powiadomienie, że podcast jest gotowy do słuchania lub udostępniania innym.

Lektor to zazwyczaj swobodna, dwustronna rozmowa o niesamowicie naturalnym tonie. Brzmi, jakbyś rozmawiał z Gemini Live, co samo w sobie brzmi znacznie bardziej naturalnie niż jakikolwiek inteligentny chatbot, z którego korzystałem do tej pory w trybie rozmowy głosowej.

Powiedziałbym, że te podcasty generowane przez sztuczną inteligencję są bardzo dobrze wykonane. Ale pociągają mnie z kilku powodów. Po pierwsze, większość dnia spędzam wpatrując się w ekran, czytając artykuły do ​​badań i pisząc własne teksty.

Tworzenie podcastu Gemini w toku.

Pozostawia to niewiele miejsca na interakcję z innymi materiałami tekstowymi, czy to akademickimi, zawodowymi, czy nawet rekreacyjnymi. Jednak jeśli uda Ci się po prostu zmienić sensoryczny sposób interakcji z tymi materiałami, zmęczenie czytaniem zmaleje.

Podcasty oferują zupełnie nowy sposób interakcji z materiałem tekstowym w bardziej immersyjny sposób. To prowadzi nas do drugiej zalety: stymulacji sensorycznej, czyli kontrastu. Ta formuła została dobrze udokumentowana i przetestowana w środowisku akademickim i szkoleniach zawodowych.

Jak mi to pomogło?

Zmęczenie czytaniem wpływa na zdolność koncentracji. Sprawia, że ​​nawet interesująca praca wydaje się uciążliwa, bo nie możesz sobie pozwolić na jej przegapienie. Jednak kontakt z tym samym dziełem, a raczej jego istotą, za pośrednictwem innego medium sensorycznego zmniejsza ten lęk przed przeciążeniem tekstem. W rzeczywistości pomaga na kilka innych sposobów.

„Angażowanie wielu zmysłów wzmacnia pamięć” – mówi Yasser Naseem, ekspert lingwistyki, którego badania koncentrują się na unowocześnianiu i rozwijaniu metod nauczania. „Kiedy słuchamy i bierzemy udział – czy to poprzez czytanie, pisanie, czy działanie – mózg buduje silniejsze połączenia, ułatwiając późniejsze zapamiętywanie”.

Naseem, który obecnie pracuje jako ekspert ds. programów nauczania w wiodącej firmie oferującej edukację online, mówi mi, że nie można polegać tylko na jednej metodzie nauki. Zamiast tego, jak twierdzi, należy łączyć różne podejścia, aby zmaksymalizować korzyści, od oddziaływania emocjonalnego po zapamiętywanie.

Gemini tworzy przegląd audio.

Badania opublikowane w czasopiśmie podkreślają Komputery i edukacja Studenci uznali również podcasty za najlepszy materiał do nauki i powtórek. Elastyczność i różnorodność sensoryczna odegrały kluczową rolę w ich wyborze podcastów spośród innych mediów.

„Prawdziwe zrozumienie i długotrwałe zapamiętywanie pojawiają się, gdy słuchanie jest połączone z wizualizacjami, dyskusjami lub ćwiczeniami praktycznymi” – dodaje Naseem. Moje własne doświadczenia z audiopodsumowaniami Gemini potwierdzają jego rady. Zapamiętuję lepiej wiedzę przyswojoną dzięki audiopodcastom niż tę, którą przyswoiłem czytając ten sam materiał..

Widzisz, te podcasty audio nie są prostą konwersją tekstu na audio. Zamiast tego zamieniają nudną ścianę tekstu w rozmowę między dwojgiem ludzi, a Ty jesteś w zasadzie jedynym odbiorcą. To prawdziwa gratka dla każdego materiału tekstowego, który nie angażuje od razu i nie zachęca do natychmiastowej lektury.

W moim ostatnim eksperymencie podcast audio Gemini pomógł mi zrozumieć znaczenie artykułu badawczego omawiającego „Ramę interpretowalnego uczenia się neuronowego opartego na lokalnych funkcjach obiektywnych opartych na informacjach”. Mówiąc prościej, badanie dotyczyło sposobu, w jaki organizują się neurony.

Rozumiesz, co chcę powiedzieć, prawda?

Komfort ponad wszystko

Gemini AI tworzy podcast audio na podstawie artykułu naukowego.

Komfort odgrywa ważną rolę w przyswajaniu informacji, podobnie jak entuzjazm i ekscytacja całym procesem. Według artykułu badawczego opublikowanego w czasopiśmie Komputery w zachowaniu ludzkimPodcasty „promują wygodę, elastyczność i dostęp do informacji i wiedzy”. Szybko to zrozumiałem.

Mieszkając w stolicy kraju, spędzanie 2-3 godzin w korkach lub w komunikacji miejskiej to dla mnie codzienność. Ale bardziej niż dyskomfort, najbardziej boli mnie stracony czas. Materiały edukacyjne w formie audio to najwygodniejszy sposób na produktywne wykorzystanie tego czasu.

Z Gemini zyskujesz kolejną istotną korzyść. Nie musisz polegać na dostępności audiobooków, artykułów prasowych czy materiałów akademickich. Możesz po prostu przesłać dowolny dostępny materiał, a Gemini przekształci go w konwersację w stylu podcastu.

Istnieje wiele interdyscyplinarnych badań potwierdzających korzyści płynące z podejścia do nauki opartego na dźwięku. Nie chodzi tu tylko o słuchanie, ale o rozłożenie materiału na czynniki pierwsze i prezentowanie go w bardziej przystępny sposób.

„Niektórzy mówili… że podoba im się to, że dajemy im coś, o czym nie czytają w gazetach” – cytują badacze redaktora. „Podoba im się to, że… staramy się prezentować w inny sposób”. Artykuł badawczy, opublikowany przez Uniwersytet Syracuse, ukazał się w 2006 roku, na samym początku trendu podcastingu.

Generowanie podcastu z przeglądem audio w Gemini.

Od 2025 roku podcasty stały się prawdziwym fenomenem w konsumpcji informacji, od materiałów edukacyjnych po rozrywkę. Według Pew Research CenterPrawie połowa Amerykanów słuchała podcastów. Ponad połowa ankietowanych słuchała ich, aby się uczyć, rozerwać lub posłuchać muzyki podczas wykonywania innych czynności.

Prawie jedna trzecia z nich chciała poznać opinie innych, a znaczna część korzystała z internetu, aby śledzić wiadomości i bieżące wydarzenia. Mój udział nie odbiegał zbytnio od opisanego powyżej schematu. W przypadku dłuższych form dziennikarskich lub śledczych, często bardziej satysfakcjonująca wydawała mi się ich wersja podcastowa.

Bardziej skuteczne również

Co ciekawe, podcasty zdają się również napędzać praktyczne zmiany. Prawie dwie trzecie słuchaczy zaangażowało się w lekturę książki lub filmu po wysłuchaniu podcastu, ponad połowa zaczęła obserwować kogoś w mediach społecznościowych, a jedna trzecia wprowadziła zmiany w stylu życia, takie jak ćwiczenia fizyczne lub zmiana diety.

Najważniejsze opublikowane badania Magazyn o marketingu w mediach społecznościowych Koncepcje takie jak substytucja mediów i podobieństwo funkcjonalne w kontekście słuchania mediów i gotowości odbiorców. Głównym założeniem jest to, że użytkownicy oceniają media i wybierają te, które najbardziej im odpowiadają.

W badaniu stwierdzono: „Jeśli chodzi o specyfikę treści podcastów, ich wpływ na chęć słuchania i substytucję mediów jest pozytywny, co sugeruje, że unikatowe treści, wysoka jakość i szeroka gama sprawiają, że ludzie chcą słuchać podcastów”. Osobiście zgadzam się z tym wnioskiem.

W ciągu ostatnich kilku dni „konwertowałem” kilka artykułów naukowych omawiających wpływ spożycia błonnika, mięsa i żywności paczkowanej na wzorce snu, zdrowie poznawcze i zdrowie jelit, do formy podcastów. W porównaniu z jawnie technicznym tonem artykułów naukowych, obecność dwóch prowadzących, którzy wyjaśniali wyniki w emocjonalnym i przekonującym tonie, wywarła na mnie znacznie głębszy wpływ.

Wyobraź sobie, że uczysz się etykiety towarzyskiej lub wrażliwości kulturowej z książki. Po latach widzisz to na własne oczy. Albo pomyśl o nauce języka obcego z książki, samodzielnie, i o tym, jaką różnicę robi nauka od kogoś, kto wypełnia twoje uszy całą tą wiedzą.

Ta druga metoda daje lepsze rezultaty. Dzieje się tak głównie dlatego, że złożony efekt zaangażowania wielu zmysłów przyspiesza proces uczenia się lub czyni go bardziej efektywnym. Podobny efekt osiągnęły materiały audio Gemini i bardzo mi pomogły.

Niektóre przeszkody

Choć brzmi to produktywnie, funkcja Audio Review w Gemini nie jest idealna. Może stracić istotę pięknie napisanej historii, próbując ją „podcastować”, lub pominąć drobne szczegóły. Występują również pewne niedociągnięcia funkcjonalne. Długość audio review, która jest wprost proporcjonalna do głębi materiału źródłowego, może być całkowicie dowolna.

Na przykład, kiedy dałem Gemini 260-stronicową książkę o koniugacji i morfologii czasowników w języku perskim, wygenerowany przez Gemini audiobook trwał nieco ponad siedem minut. Jakościowo obejmował on najważniejsze części, ale pomijał drobniejsze szczegóły.

W innym przypadku przekształciłem czterostronicowy, szczegółowy dokument badawczy w podcast audio. Ten podcast trwał około 13 minut. Niestety, zautomatyzowany układ zadań Gemini nie pozwala na dostosowanie długości ani głębokości rozmowy w podglądzie audio.

Jeśli korzystasz z Google NotebookLM, gdzie zadebiutowała funkcja przeglądu dźwięku, możesz napisać polecenie, które określi poziom szczegółowości rozmowy w podcaście. Kilka tygodni temu stworzyłem w NotebookLM podcast audio o długości 59 minut.

Bliźnięta ci na to nie pozwolą. Jeszcze nie.

Dochodzi jeszcze bariera językowa, ponieważ Google pracuje obecnie nad ulepszeniem całego swojego systemu poza językiem angielskim. Kolejnym problemem jest wymowa zapożyczona z języka angielskiego. Na przykład, prowadzący podcast o sztucznej inteligencji błędnie wymówił perskie słowo „Raf-thin” jako „Raaf-tin”.

Dla niewprawnego ucha, które nie zna dwujęzycznych różnic między tłumaczeniem na język angielski i perski ani tego, jak akcenty wpływają na słuchową percepcję słów w innym języku, prowadzący podcasty oparte na sztucznej inteligencji mogą mówić kompletne bzdury.

Moje ogólne doświadczenie jest takie, że „audiopodsumowania” w Gemini nie są rewolucyjne. Oferują po prostu inny, bardziej angażujący sposób interakcji z treścią. Nie działają one zawsze, ale z pewnością łagodzą nudę związaną z czytaniem stron tekstu, które w przeciwnym razie usypiałyby.

Możliwość dodawania komentarzy nie jest dostępna.