Narzędzie Gemini firmy Google może wkrótce wykonać Twoją pracę.

Doniesienia wskazują, że Google pracuje nad znaczącą aktualizacją swojego asystenta opartego na sztucznej inteligencji. GeminiTo mogłoby przekształcić go z asystenta konwersacyjnego w coś bliższego prawdziwemu agentowi biznesowemu. Niedawna analiza eksperymentalna kodu aplikacji Google autorstwa [imię i nazwisko autora] 9to5GoogleProgramiści odkryli fragmenty kodu wskazujące na funkcję wewnętrznie znaną jako „automatyzacja ekranu”. Sugeruje to, że Gemini może wkrótce wykonywać czynności bezpośrednio w Twoim imieniu w niektórych aplikacjach na Androida, takich jak składanie zamówień czy rezerwowanie lotów, bez konieczności ręcznego dotykania ekranu.

Chociaż Gemini obsługuje już zadania konwersacyjne, takie jak pisanie e-maili czy tworzenie planów badawczych, ta aktualizacja wydaje się mieć na celu umożliwienie mu bezpośredniej interakcji z interfejsami aplikacji, dotykania przycisków i nawigacji po ekranach, aby wykonywać zadania, które normalnie wykonywałbyś samodzielnie. Wstępne dane z wersji beta sugerują, że te funkcje będą początkowo ograniczone do kilku obsługiwanych aplikacji i będą kładły nacisk na nadzór użytkownika, a Google ostrzega, że ​​„Gemini może popełniać błędy” i że użytkownicy pozostają odpowiedzialni za działania podejmowane w ich imieniu.

Logo Gemini Advanced

W jaki sposób ta aktualizacja przekształca sztuczną inteligencję z asystenta w agenta?

Koncepcja automatyzacji ekranów stanowi istotny krok w kierunku zapewnienia sztucznej inteligencji większej autonomii w codziennych cyfrowych procesach pracy. Zamiast jedynie sugerować, co można zrobić, Gemini może wkrótce wdrożyć te opcje bezpośrednio w aplikacjach. Wczesne fragmenty kodu z wersji beta Google wskazują również na środki ostrożności związane z prywatnością, takie jak zalecenie użytkownikom, aby nie wprowadzali danych logowania ani płatności w rozmowach ze sztuczną inteligencją, oraz ostrzeżenie, że zrzuty ekranu mogą być analizowane w celu ulepszenia funkcji. Google oferuje już pewne funkcje agentów za pośrednictwem platformy Gemini Agent w Workspace i w internecie, gdzie sztuczna inteligencja może obsługiwać złożone procesy i koordynować pracę między usługami. Automatyzacja ekranów może jednak przenieść te funkcje bezpośrednio na smartfony i do codziennego użytku z aplikacjami.

Zdjęcie przedstawiające aplikację Google Gemini działającą na telefonie Pixel.

Jeśli te funkcje zostaną szeroko wdrożone, może to oznaczać zmianę w sposobie, w jaki ludzie wchodzą w interakcję z urządzeniami mobilnymi – od dotykania i przesuwania ekranu po udzielanie narzędziom AI uprawnień do działania w ich imieniu. Mogłoby to usprawnić codzienne czynności, ale rodzi również pytania o kontrolę, bezpieczeństwo i nadzór, zwłaszcza gdy automatyzacja dotyczy wrażliwych zadań, takich jak rezerwacje czy transakcje finansowe.

Według doniesień, Google pozycjonuje te aktualizacje jako opcjonalne i nadzorowane, umożliwiając użytkownikom wyłączenie lub nadpisanie Gemini w dowolnym momencie. Jednak funkcja automatyzacji ekranu jest wciąż w fazie rozwoju i nie doczekała się jeszcze stabilnej wersji.

Możliwość dodawania komentarzy nie jest dostępna.