5 najważniejszych wiadomości ze świata sztucznej inteligencji, które przegapiłeś w tym tygodniu: aktualizacje ChatGPT i najnowsze działania Google
W tym tygodniu pojawiło się kilka niespodzianek od firm z branży sztucznej inteligencji, które nie były w centrum uwagi. Wygląda na to, że Bliźnięta Google’a W drodze do stania się ulubieńcem fanów, podczas gdy Grok Zajmuje pierwsze miejsce na liście najlepiej działających chatbotów. Nowy medyczny model sztucznej inteligencji pomaga lekarzom wykryć ponad 1000 chorób, w tym raka.

Tymczasem ChatGPT podejmuje zdecydowane kroki w celu zwiększenia bezpieczeństwa wśród najmłodszych użytkowników, wprowadzając zabezpieczenia dla użytkowników poniżej 18 roku życia. Oto najważniejsze wiadomości ze świata sztucznej inteligencji, które musisz znać w tym tygodniu.
Gemini jest faworytem wśród 27 różnych modeli sztucznej inteligencji.

W jednym z największych tego typu badań opinii publicznej wzięło udział ponad 21 000 uczestników z USA i Wielkiej Brytanii, którzy ocenili 27 różnych modeli sztucznej inteligencji – i Bliźnięta 2.5 Pro Na szczycie listy. Badanie przeprowadzone z wykorzystaniem systemu Humaine firmy Prolific, oceniało modele na podstawie takich kryteriów, jak styl komunikacji, zdolność wnioskowania, poziom zaufania i ogólne doświadczenie użytkownika.
Gemini wyprzedziło swoich konkurentów, w tym ChatGPT i Claude, w większości podkategorii, umacniając swoją pozycję jako najbardziej zaawansowanego modelu wnioskowania Google. ChatGPT zajął ósme miejsce w klasyfikacji generalnej.
Najważniejsze punkty:
- Gemini 2.5 Pro zajmuje pierwsze miejsce W sondażu opinii publicznej przeprowadzonym wśród 27 modelek w USA i Wielkiej Brytanii.
- 21 352 osób udostępniło Pochodzą z różnych grup demograficznych.
- Kryteria oceny:Komunikacja, elastyczność, rozumowanie, zaufanie i ogólne wrażenia użytkownika.
- ChatGPT zajął ósme miejsce Ogólnie wydawnictwa Claude'a zajęły odpowiednio 11. i 12. miejsce.
ChatGPT tworzy funkcje specjalnie dla nastolatków

Wreszcie OpenAI zostaje uruchomiony Nowe zasady bezpieczeństwa dla nastolatkówAktualizacje obejmują system przewidywania wieku, który wykrywa użytkowników poniżej 18 roku życia, z zachowaniem ostrożności poprzez stosowanie mechanizmów kontroli prewencyjnej, jeśli wiek jest nieznany. Obiecano również bardziej rygorystyczne filtry dla tematów drażliwych (treści seksualne, samookaleczenia itp.), a także kontrolę rodzicielską, taką jak blokowanie godzin i możliwość łączenia kont.
Te zmiany to dopiero początek, ale rodzą trudne pytania o to, jak będzie definiowany wiek, jak często błędy będą wpływać na zaufanie i czy nastolatki będą czuły się bezpiecznie, otwierając się, jeśli boją się, że będą obserwowane lub oceniane.
Co powinieneś wiedzieć
- Nowa zasada wykrywania wiekuOpenAI przekieruje użytkowników, których uzna za osoby poniżej 18 roku życia, do wersji ChatGPT o bardziej rygorystycznych zasadach bezpieczeństwa.
- Domyślne dla osób niepełnoletnichJeśli wieku nie można potwierdzić, system i tak podejmuje środki ostrożności, stosując drobne ograniczenia.
- Zapewnianie narzędzi kontroli rodzicielskiejRodzice mogą połączyć się z kontem nastolatka, wyłączyć lub ograniczyć funkcje (takie jak pamięć lub historia), ustawić bezpieczne godziny (zablokować godziny) i otrzymywać powiadomienia, jeśli sztuczna inteligencja wykryje oznaki niepokoju.
- Ograniczenia czatu dla nastolatkówTreści o charakterze jednoznacznie seksualnym, flirt i rozmowy o samookaleczeniu są zabronione. W skrajnych przypadkach, gdy istnieje niebezpieczeństwo bezpośredniego zagrożenia, można skontaktować się z organami ścigania, jeśli nie można skontaktować się z rodzicami.
Teraz możesz udostępniać swoje własne dzieła Gemini.

Google rozszerza zasięg Gemini, dając użytkownikom możliwość udostępniania swoich spersonalizowanych asystentów, Gems. Dla tych, którzy lepiej znają ChatGPT, są to w zasadzie Niestandardowe modele GPTPrzedtem to było Klejnoty Bliźniąt Choć jest on przeznaczony wyłącznie do prywatnego użytku, można go teraz udostępniać tak łatwo jak Dokumenty Google, dzięki czemu współpracownicy, studenci i wszyscy inni mogą współpracować ze sztuczną inteligencją zaprojektowaną na zamówienie, bez konieczności tworzenia jej od podstaw.
Ten krok jest dowodem na dążenie Google do uczynienia Gemini bardziej elastyczną i przyjazną dla użytkownika platformą.
Co musisz wiedzieć:
- Personalizowane klejnoty Są to wspomagani sztuczną inteligencją asystenci, których można zaprojektować do wykonywania konkretnych zadań, takich jak programowanie, edycja czy burza mózgów.
- Klejnoty są dzielone Podobnie jak w przypadku udostępniania dowolnych innych treści na Dysku Google, podczas współpracy inni użytkownicy mogą przeglądać i edytować Twoje Gem.
- Dostępne teraz dla subskrybentów Gemini Advanced, Business i Enterprise w ponad 150 krajach.
Grok na szczycie listy ARC-AGI

Elon Musk i Grok 4 zdają się przewodzić w wyścigu sztucznej inteligencji, zajmując pierwsze miejsce na liście ARC-AGI, benchmarku mierzącego liczbę problemów, które sztuczna inteligencja może rozwiązać, oraz wydajność modelu. W ostatnich testach Grok 4 przewyższył konkurencję, taką jak ChatGPT i Gemini, pod względem tego wymagającego wskaźnika, co podkreśla jego wyższą zdolność do rozwiązywania rzeczywistych problemów i szybkość.
Pomimo szybkości, wykorzystania funkcji wyszukiwania w czasie rzeczywistym w sieci i imponującego przetwarzania skomplikowanych zagadnień inżynieryjnych, użytkownicy wciąż mają wątpliwości co do dokładności Groka, moderowania treści i stronniczości.
Co musisz wiedzieć:
- Topper listy ARC-AGIGrok 4 twierdzi, że jest numerem 1 w rankingu, co oznacza, że rozwiązuje więcej standardowych problemów związanych ze sztuczną inteligencją na jednostkę zasobów niż konkurencyjne gry.
- Mocne strony:Praktycznie natychmiastowe wyszukiwanie w sieci, ulepszona obsługa złożonych zadań geometrycznych i logicznych oraz zwiększona wydajność w porównaniu z poprzednimi wersjami Grok.
- Słabości i lęki
:Problemy z dokładnością treści (niektóre nieprawdziwe twierdzenia), problemy z uprzedzeniami oraz wyzwanie związane z utrzymaniem moderacji i niezawodności przy intensywnym użytkowaniu. - Wniosek:Pokazuje, że wydajność i jakość są coraz częściej nagradzane w testach porównawczych sztucznej inteligencji.
Nowy model sztucznej inteligencji przewiduje ryzyko wystąpienia ponad 1000 chorób, w tym raka.

Nowy model sztucznej inteligencji o nazwie Delphi-2M stanowi przełom w dziedzinie medycznej sztucznej inteligencji. Wyszkolony na zanonimizowanych danych zdrowotnych pochodzących od prawie 2.3 miliona osób w Wielkiej Brytanii i Danii, potrafi przewidzieć ryzyko wystąpienia ponad 1000 chorób i oszacować, kiedy mogą one wystąpić.
W przeciwieństwie do innych modeli sztucznej inteligencji, Delphi-2M oblicza ryzyko dla 1000 przypadków, wykorzystując historię chorób, czynniki związane ze stylem życia, wiek i płeć do symulacji przebiegu choroby na przestrzeni dekad. Model ten potrafi przewidzieć nie tylko, jaka choroba może wystąpić, ale także kiedy.
W eksperymentach system osiągnął średni obszar pod krzywą (AUC) na poziomie 0.76 dla setek chorób w brytyjskich zbiorach danych, chociaż dokładność spadła w populacjach duńskich. Należy podkreślić, że ten model nie jest narzędziem diagnostycznym i nie zastępuje lekarzy.
Narzędzie to ma jednak potencjał jako narzędzie predykcyjne, przydatne do monitorowania ogólnych trendów ryzyka, planowania działań zapobiegawczych i podkreślania potencjału sztucznej inteligencji w zakresie zdrowia osobistego.
Najważniejsze punkty:
- ogromny zbiór danych:Przeszkolono blisko 2.3 miliona osób z brytyjskiego Biobanku i duńskich rejestrów.
- Modelowanie kompleksowe i czasoweWykorzystuje szczegółowe dane (wiek, płeć, styl życia, poprzednie diagnozy) i przewiduje zarówno następną chorobę, jak i następujące schorzenia: ومتى Tak się stanie.
- Prognoza, nie diagnoza:Niniejszy dokument ma służyć jako wskazówka dotycząca profilaktyki, a nie jako zamiennik porady lekarskiej.
Wniosek
W ciągu zaledwie jednego tygodnia aktualizacje te uwypukliły wyraźną zmianę w krajobrazie sztucznej inteligencji w kierunku integracji ze światem rzeczywistym i większych przełomów.
Możliwość dodawania komentarzy nie jest dostępna.