Modele sztucznej inteligencji: ogromne możliwości, ale nie sprawdzają się w branży gier wideo

W miarę rozwoju narzędzi sztucznej inteligencji jesteśmy stale zachęcani do delegowania im złożonych zadań. Duże modele językowe mogąLLMPiszemy e-maile, tworzymy prezentacje, projektujemy aplikacje, tworzymy filmy, przeszukujemy internet i podsumowujemy wyniki, i wiele więcej. Jednak jedną z rzeczy, z którymi wciąż mamy problem, są gry wideo.

W tym roku dwie największe firmy z branży sztucznej inteligencji (Microsoft i Anthropic) próbowały zmusić swoje modele do tworzenia lub grania w gry, a rezultaty okazały się znacznie bardziej ograniczone, niż wielu się spodziewało. Uwydatnia to obecne wyzwania stojące przed generatywną sztuczną inteligencją, szczególnie w przypadku zadań wymagających długoterminowego planowania strategicznego i złożonego podejmowania decyzji.

To sprawia, że stanowią one idealną demonstrację tego, do czego naprawdę zdolna jest dziś sztuczna inteligencja generatywna – krótko mówiąc: potrafi o wiele więcej niż kiedyś, ale nie wszystko. To pokazuje, że sztuczna inteligencja generatywna wciąż ewoluuje i pomimo rosnących możliwości, wciąż napotyka ograniczenia w niektórych obszarach.

Microsoft produkuje Quake II ze sztuczną inteligencją

Produkcja gier wideo stoi przed wyzwaniami podobnymi do tych, z którymi boryka się produkcja wideo, gdzie ruch jest dziwny i zniekształcony, a sztuczna inteligencja po pewnym czasie zaczyna tracić kontakt z „rzeczywistością”. Najnowsza próba Microsoftu, która Każdy może tego spróbować.Jest to wersja wygenerowana przez sztuczną inteligencję Quake II.

Grałem w tę grę kilka razy i to naprawdę osobliwe doświadczenie. Dezorientujący przeciwnicy pojawiają się znikąd, a otoczenie zmienia się wraz z ruchem. Kilka razy, gdy wchodziłem do nowego pokoju, wejście znikało, gdy się odwracałem, a kiedy znów patrzyłem przed siebie, ściany się poruszały.

Gra trwa zaledwie kilka minut, po czym zostaje zatrzymana i pojawia się monit o rozpoczęcie nowej gry. Jeśli jednak masz pecha, gra może przestać reagować na Twoje polecenia jeszcze wcześniej.

Mimo wszystko to fascynujący eksperyment i myślę, że będzie on przydatny dla większej liczby osób. Pozwala on przekonać się na własne oczy, do czego zdolna jest generatywna sztuczna inteligencja i jakie są jej obecne ograniczenia. Choć sam fakt, że udało nam się stworzyć interaktywną grę wideo, jest imponujący, trudno sobie wyobrazić, żeby ktokolwiek grając w tę wersję demonstracyjną technologii uwierzył, że kolejny Assassin's Creed będzie generowany przez sztuczną inteligencję.

Jednak tego typu idee i założenia istnieją, głównie dlatego, że ludzie nie mogą uniknąć słuchania o sztucznej inteligencji już teraz. Nawet jeśli w ogóle nie interesuje Cię sztuczna inteligencja, i tak jest ona narzucana Ci wszędzie, gdziekolwiek się udasz. Problem polega na tym, że informacje, które otrzymuje przeciętny człowiek, składają się niemal wyłącznie z komentarzy marketingowych dużych firm technologicznych i komentarzy kierownictwa podchwytywanych przez publikacje prasowe.

Oznacza to, że słyszą przesadzone i sprzeczne twierdzenia, takie jak te:

Ma potencjał rozwiązania niektórych z największych problemów współczesnego świata, takich jak zmiana klimatu, ubóstwo i choroby.Bill Gates)

Jest prawdopodobne, że w 2025 roku my w Meta, jak i w innych firmach, które przede wszystkim nad tym pracują, będziemy mieli sztuczną inteligencję, która będzie w stanie pełnić rolę przeciętnego inżyniera w firmie i będzie potrafiła wydajnie pisać kod.Mark Zuckerberg)

Efektywne wykorzystanie sztucznej inteligencji jest obecnie podstawowym oczekiwaniem każdego w Shopify. To narzędzie dla każdego zawodu i z czasem będzie zyskiwać na znaczeniu. Szczerze mówiąc, nie sądzę, żeby dało się uniknąć nauki stosowania sztucznej inteligencji w firmie.Toby Lutke(dyrektor generalny Shopify)

Jesteśmy teraz przekonani, że wiemy, jak zbudować sztuczną inteligencję ogólną (AGI) w tradycyjnym rozumieniu. Wierzymy, że w 2025 roku możemy być świadkami „dołączenia” pierwszych agentów AI do siły roboczej i fundamentalnej transformacji sposobu produkcji w firmach.Sam Altman(dyrektor generalny OpenAI)

Sztuczna inteligencja jest groźniejsza niż, powiedzmy, źle zaprojektowana maszyna latająca, źle wykonana konserwacja produkcji czy źle wyprodukowane samochody, ponieważ ma potencjał – choć niewielki, to jednak niebłahy – zniszczenia cywilizacji.Elon Musk)

To wszystko brzmi trochę naciągane, prawda? Ma nas jednocześnie ratować i niszczyć, być uniwersalnym narzędziem dla profesjonalistów i narzędziem, które ich zastąpi – i wygląda na to, że możemy dostać sztuczną inteligencję ogólną na poziomie science fiction już w tym roku. Kiedy ludzie o tym słyszą, zaczynają oczekiwać niesamowitych rzeczy od tych narzędzi i wierzą, że wszyscy pracownicy biurowi spędzają dni rozmawiając z komputerami jak bohaterowie Star Treka.

Jednak rzeczywistość wygląda inaczej. Rzeczywistość przypomina chwiejnego, chaotycznego Quake'a II z niezrozumiałymi kształtami wrogów. Modele LLM na poziomie ChatGPT rzeczywiście były ekscytującym przełomem w 2022 roku i dostarczyły wszystkim mnóstwo frajdy – ale do większości zastosowań, które teraz propagują duże firmy technologiczne, sztuczna inteligencja po prostu nie jest w stanie sprostać wymaganiom. Poziomy dokładności są zbyt niskie, zdolności do wykonywania poleceń zbyt niskie, zakresy kontekstowe zbyt małe, a sztuczna inteligencja jest trenowana wyłącznie na internetowym bełkocie, a nie na wiedzy z realnego świata.

Ale stworzenie gry wideo to bardzo złożone przedsięwzięcie – w końcu potrzeba na to lat pracy całych zespołów ludzi. A co powiecie na granie w gry wideo?

Claude „gra” w Pokémon Red

Okazuje się, że ludzie eksperymentują również w tej dziedzinie. Najnowszy model firmy Anthropic, który Klaudiusz 3.7 Sonet On gra Pokémon Red na Twitchu Istnieje już od około dwóch miesięcy i radzi sobie najlepiej, jak kiedykolwiek zrobił to model dużego języka (LLM) w graniu w Pokémony. Jest jednak mały haczyk: wciąż jest daleko w tyle za przeciętnym dziesięciolatkiem.

Jednym z problemów jest szybkość – Clude wykonuje tysiące czynności w ciągu kilku dni, na przykład przemierzając Las Viridian. Odzwierciedla to wyzwania, przed którymi stoi sztuczna inteligencja w obsłudze złożonych zadań.

Dlaczego to tak długo trwa? Nie dlatego, że nie potrafi strategicznie wygrywać bitew Pokémon – to właśnie w tym jest dobry. Z drugiej strony, poruszanie się po otoczeniu, omijanie drzew i budynków – nie jest w tym najlepszy. Claude nigdy nie był szkolony do gry w Pokémony i niełatwo mu zrozumieć pikselową grafikę i to, co ona przedstawia. Te trudności uwydatniają przepaść między jego zdolnością przetwarzania danych a zdolnością do interakcji ze złożonym otoczeniem.

Poruszanie się po labiryntowych obszarach, takich jak Góra Księżyca, jest dla niego szczególnie trudne, ponieważ z trudem mapuje teren i unika konieczności powrotu po swoich śladach. Pewnego razu utknął w kącie tak bardzo, że doszedł do wniosku, że gra jest zepsuta i zażądał jej zresetowania. To pokazuje, że sztuczna inteligencja, pomimo zaawansowanych możliwości, wciąż nie posiada tak intuicyjnego rozumienia, jak ludzie.

W tych wczesnych próbach także nie brakowało zabawnych momentów.

Pewnego razu Claude znalazł się w sytuacji bez wyjścia i przekonany, że coś jest nie tak, napisał formalną prośbę o zresetowanie gry. pic.twitter.com/5RIiCJdxCM— Antropiczny (@AntropicznyAI) 25 lutego 2025 r.

Nie jest też dobry w zapamiętywaniu celów, rzeczy, które już wypróbował i miejsc, które wcześniej odwiedził.

Powód jest bardzo prosty – duże modele językowe (LLM) mają ograniczone „okno kontekstowe”, które działa jak ich pamięć. Mogą pomieścić tylko określoną ilość informacji, a gdy Claude osiągnie limit, kompresuje to, co ma, aby zrobić miejsce na więcej. Zatem informacja taka jak „odwiedziłem Viridian City, wszedłem do każdego budynku i rozmawiałem z każdą postacią niezależną (NPC)” może zostać skompresowana do samego „odwiedziłem Viridian City” – co skłoni Claude'a do powrotu i sprawdzenia, czy w mieście jest coś do zrobienia.

Krótko mówiąc: Claude nie wie, dokąd idzie, wpada na ściany, gubi się wśród przypadkowych obiektów i postaci niezależnych (NPC), zapomina, gdzie był i co próbuje zrobić, a każda podejmowana decyzja wymaga długich akapitów przemyśleń. To nie jest krytyka – to ekscytujące eksperymenty, które przesuwają granice możliwości dużych modeli językowych (LLM).

Ale przy całym szumie wokół sztucznej inteligencji (AI), ważne jest, aby ludzie oglądali takie dema i wyrabiali sobie własne zdanie na jej temat. Niektórzy próbują wmówić, że zbliżamy się do szczytu rozwoju AI – że w ciągu kilku lat AI przewyższy nawet najinteligentniejszych ludzi – ale nie sądzę, żeby byli szczerzy; po prostu są sprzedawcami. Jesteśmy jeszcze daleko od szczytu rozwoju AI; to wszystko dopiero się rozkręca.