5 najważniejszych wiadomości ze świata sztucznej inteligencji, które przegapiłeś w tym tygodniu: aktualizacje ChatGPT i najnowsze działania Google

W tym tygodniu pojawiło się kilka niespodzianek od firm z branży sztucznej inteligencji, które nie były w centrum uwagi. Wygląda na to, że Bliźnięta Google’a W drodze do stania się ulubieńcem fanów, podczas gdy Grok Zajmuje pierwsze miejsce na liście najlepiej działających chatbotów. Nowy medyczny model sztucznej inteligencji pomaga lekarzom wykryć ponad 1000 chorób, w tym raka.

Tymczasem ChatGPT podejmuje zdecydowane kroki w celu zwiększenia bezpieczeństwa wśród najmłodszych użytkowników, wprowadzając zabezpieczenia dla użytkowników poniżej 18 roku życia. Oto najważniejsze wiadomości ze świata sztucznej inteligencji, które musisz znać w tym tygodniu.

Gemini jest faworytem wśród 27 różnych modeli sztucznej inteligencji.

W jednym z największych tego typu badań opinii publicznej wzięło udział ponad 21 000 uczestników z USA i Wielkiej Brytanii, którzy ocenili 27 różnych modeli sztucznej inteligencji – i Bliźnięta 2.5 Pro Na szczycie listy. Badanie przeprowadzone z wykorzystaniem systemu Humaine firmy Prolific, oceniało modele na podstawie takich kryteriów, jak styl komunikacji, zdolność wnioskowania, poziom zaufania i ogólne doświadczenie użytkownika.

Gemini wyprzedziło swoich konkurentów, w tym ChatGPT i Claude, w większości podkategorii, umacniając swoją pozycję jako najbardziej zaawansowanego modelu wnioskowania Google. ChatGPT zajął ósme miejsce w klasyfikacji generalnej.

Najważniejsze punkty:

Gemini 2.5 Pro zajmuje pierwsze miejsce W sondażu opinii publicznej przeprowadzonym wśród 27 modelek w USA i Wielkiej Brytanii.
21 352 osób udostępniło Pochodzą z różnych grup demograficznych.
Kryteria oceny:Komunikacja, elastyczność, rozumowanie, zaufanie i ogólne wrażenia użytkownika.
ChatGPT zajął ósme miejsce Ogólnie wydawnictwa Claude'a zajęły odpowiednio 11. i 12. miejsce.

ChatGPT tworzy funkcje specjalnie dla nastolatków

Wreszcie OpenAI zostaje uruchomiony Nowe zasady bezpieczeństwa dla nastolatkówAktualizacje obejmują system przewidywania wieku, który wykrywa użytkowników poniżej 18 roku życia, z zachowaniem ostrożności poprzez stosowanie mechanizmów kontroli prewencyjnej, jeśli wiek jest nieznany. Obiecano również bardziej rygorystyczne filtry dla tematów drażliwych (treści seksualne, samookaleczenia itp.), a także kontrolę rodzicielską, taką jak blokowanie godzin i możliwość łączenia kont.

Te zmiany to dopiero początek, ale rodzą trudne pytania o to, jak będzie definiowany wiek, jak często błędy będą wpływać na zaufanie i czy nastolatki będą czuły się bezpiecznie, otwierając się, jeśli boją się, że będą obserwowane lub oceniane.

Co powinieneś wiedzieć

Nowa zasada wykrywania wiekuOpenAI przekieruje użytkowników, których uzna za osoby poniżej 18 roku życia, do wersji ChatGPT o bardziej rygorystycznych zasadach bezpieczeństwa.
Domyślne dla osób niepełnoletnichJeśli wieku nie można potwierdzić, system i tak podejmuje środki ostrożności, stosując drobne ograniczenia.
Zapewnianie narzędzi kontroli rodzicielskiejRodzice mogą połączyć się z kontem nastolatka, wyłączyć lub ograniczyć funkcje (takie jak pamięć lub historia), ustawić bezpieczne godziny (zablokować godziny) i otrzymywać powiadomienia, jeśli sztuczna inteligencja wykryje oznaki niepokoju.
Ograniczenia czatu dla nastolatkówTreści o charakterze jednoznacznie seksualnym, flirt i rozmowy o samookaleczeniu są zabronione. W skrajnych przypadkach, gdy istnieje niebezpieczeństwo bezpośredniego zagrożenia, można skontaktować się z organami ścigania, jeśli nie można skontaktować się z rodzicami.

Teraz możesz udostępniać swoje własne dzieła Gemini.

Google rozszerza zasięg Gemini, dając użytkownikom możliwość udostępniania swoich spersonalizowanych asystentów, Gems. Dla tych, którzy lepiej znają ChatGPT, są to w zasadzie Niestandardowe modele GPTPrzedtem to było Klejnoty Bliźniąt Choć jest on przeznaczony wyłącznie do prywatnego użytku, można go teraz udostępniać tak łatwo jak Dokumenty Google, dzięki czemu współpracownicy, studenci i wszyscy inni mogą współpracować ze sztuczną inteligencją zaprojektowaną na zamówienie, bez konieczności tworzenia jej od podstaw.

Ten krok jest dowodem na dążenie Google do uczynienia Gemini bardziej elastyczną i przyjazną dla użytkownika platformą.

Co musisz wiedzieć:

Personalizowane klejnoty Są to wspomagani sztuczną inteligencją asystenci, których można zaprojektować do wykonywania konkretnych zadań, takich jak programowanie, edycja czy burza mózgów.
Klejnoty są dzielone Podobnie jak w przypadku udostępniania dowolnych innych treści na Dysku Google, podczas współpracy inni użytkownicy mogą przeglądać i edytować Twoje Gem.
Dostępne teraz dla subskrybentów Gemini Advanced, Business i Enterprise w ponad 150 krajach.

Grok na szczycie listy ARC-AGI

Elon Musk i Grok 4 zdają się przewodzić w wyścigu sztucznej inteligencji, zajmując pierwsze miejsce na liście ARC-AGI, benchmarku mierzącego liczbę problemów, które sztuczna inteligencja może rozwiązać, oraz wydajność modelu. W ostatnich testach Grok 4 przewyższył konkurencję, taką jak ChatGPT i Gemini, pod względem tego wymagającego wskaźnika, co podkreśla jego wyższą zdolność do rozwiązywania rzeczywistych problemów i szybkość.

Pomimo szybkości, wykorzystania funkcji wyszukiwania w czasie rzeczywistym w sieci i imponującego przetwarzania skomplikowanych zagadnień inżynieryjnych, użytkownicy wciąż mają wątpliwości co do dokładności Groka, moderowania treści i stronniczości.

Co musisz wiedzieć:

Topper listy ARC-AGIGrok 4 twierdzi, że jest numerem 1 w rankingu, co oznacza, że rozwiązuje więcej standardowych problemów związanych ze sztuczną inteligencją na jednostkę zasobów niż konkurencyjne gry.
Mocne strony:Praktycznie natychmiastowe wyszukiwanie w sieci, ulepszona obsługa złożonych zadań geometrycznych i logicznych oraz zwiększona wydajność w porównaniu z poprzednimi wersjami Grok.
Słabości i lęki
:Problemy z dokładnością treści (niektóre nieprawdziwe twierdzenia), problemy z uprzedzeniami oraz wyzwanie związane z utrzymaniem moderacji i niezawodności przy intensywnym użytkowaniu.
Wniosek:Pokazuje, że wydajność i jakość są coraz częściej nagradzane w testach porównawczych sztucznej inteligencji.

Nowy model sztucznej inteligencji przewiduje ryzyko wystąpienia ponad 1000 chorób, w tym raka.

Nowy model sztucznej inteligencji o nazwie Delphi-2M stanowi przełom w dziedzinie medycznej sztucznej inteligencji. Wyszkolony na zanonimizowanych danych zdrowotnych pochodzących od prawie 2.3 miliona osób w Wielkiej Brytanii i Danii, potrafi przewidzieć ryzyko wystąpienia ponad 1000 chorób i oszacować, kiedy mogą one wystąpić.

W przeciwieństwie do innych modeli sztucznej inteligencji, Delphi-2M oblicza ryzyko dla 1000 przypadków, wykorzystując historię chorób, czynniki związane ze stylem życia, wiek i płeć do symulacji przebiegu choroby na przestrzeni dekad. Model ten potrafi przewidzieć nie tylko, jaka choroba może wystąpić, ale także kiedy.

W eksperymentach system osiągnął średni obszar pod krzywą (AUC) na poziomie 0.76 dla setek chorób w brytyjskich zbiorach danych, chociaż dokładność spadła w populacjach duńskich. Należy podkreślić, że ten model nie jest narzędziem diagnostycznym i nie zastępuje lekarzy.

Narzędzie to ma jednak potencjał jako narzędzie predykcyjne, przydatne do monitorowania ogólnych trendów ryzyka, planowania działań zapobiegawczych i podkreślania potencjału sztucznej inteligencji w zakresie zdrowia osobistego.

Najważniejsze punkty:

ogromny zbiór danych:Przeszkolono blisko 2.3 miliona osób z brytyjskiego Biobanku i duńskich rejestrów.
Modelowanie kompleksowe i czasoweWykorzystuje szczegółowe dane (wiek, płeć, styl życia, poprzednie diagnozy) i przewiduje zarówno następną chorobę, jak i następujące schorzenia: ومتى Tak się stanie.
Prognoza, nie diagnoza:Niniejszy dokument ma służyć jako wskazówka dotycząca profilaktyki, a nie jako zamiennik porady lekarskiej.

Wniosek

W ciągu zaledwie jednego tygodnia aktualizacje te uwypukliły wyraźną zmianę w krajobrazie sztucznej inteligencji w kierunku integracji ze światem rzeczywistym i większych przełomów.