Google Gemini obsługuje teraz przesyłanie plików audio i innych nowych typów plików.

Przez miesiące aplikacja Google Gemini potrafiła przetwarzać przesłane obrazy, pliki PDF, a nawet filmy, ale dźwięk był wyraźnie nieobecny. To się dziś zmienia. Google po cichu wprowadziło jedną z najczęściej wyczekiwanych funkcji w Gemini: przesyłanie plików audio.

Google Gemini obsługuje teraz przesyłanie plików audio i innych nowych typów plików: kompleksowy przewodnik po dodanych funkcjach i sposobach ich wykorzystania

Szersze wsparcie, więcej zastosowań

Długo oczekiwana funkcja

Odblokowany Samsung Galaxy Z Flip 7 z aplikacją Gemini

Josh Woodward, wiceprezes Google Labs i Gemini, potwierdził, Wprowadzenie funkcji na XAktualizacja została określona jako „Żądanie nr 1” i jest już dostępna na urządzeniach z systemem Android, iOS oraz w Internecie. Umożliwia ona dodawanie plików w formacie MP3, WAV i większości innych popularnych formatów poprzez dotknięcie znanej opcji „Prześlij pliki”.

Jak można się domyślić, istnieją pewne ograniczenia. Dla użytkowników Gemini z bezpłatną subskrypcją Możesz przesłać maksymalnie 10 plików jednocześnie, ale łączna długość przesyłanych plików audio nie może przekraczać 10 minut. Jeśli subskrybujesz płatne plany Google – Gemini Advanced przez AI Pro lub AI Ultra – limit ten znacznie wzrasta, do trzech godzin.

Choć nie jest nieograniczony, jest stosunkowo hojny. W porównaniu do tego wciąż jest Przesyłanie filmów w Gemini Użytkownicy korzystający z wersji darmowej mają limit pięciu minut, a użytkownicy korzystający z wersji płatnej – jednej godziny. Audio podwaja ten bezpłatny limit, oferując jednocześnie trzykrotnie więcej miejsca dla subskrybentów korzystających z wersji płatnej, co ma sens w przypadku takich zastosowań jak transkrypcja, analiza notatek ze spotkań czy analiza podcastów.

Brak obsługi dźwięku był dziwnym zaniedbaniem od czasu wprowadzenia funkcji przesyłania plików na początku tego roku. Gemini potrafił już streszczać filmy z YouTube i obsługiwać krótkie klipy, ale nagrywanie krótkich notatek głosowych i proszenie sztucznej inteligencji o ich przetwarzanie nie było możliwe do tej pory.

Dzięki temu Gemini zbliża się do funkcji oferowanych przez konkurencję, taką jak ChatGPT firmy OpenAI, który od miesięcy obsługuje przesyłanie plików audio i tekstowych. Pytanie pozostaje: czy 10 minut wystarczy przeciętnemu użytkownikowi? Ta różnica sugeruje, że Google chce, aby przetwarzanie dźwięku było kolejną zachętą do subskrypcji. W każdym razie, jeśli czekałeś na możliwość dodania klipu podcastu, fragmentu wykładu, a nawet własnych losowych notatek głosowych do Gemini, teraz masz szansę to wypróbować.

Google Bliźnięta


Google Bliźnięta

wydajność

Cena: za darmo
⭐ 4.6


⬇️ Pobierz

Możliwość dodawania komentarzy nie jest dostępna.