Chińska firma Alibaba wyprzedza Meta dzięki nowym modelom sztucznej inteligencji Qwen 3

Abstrakcyjny:

  • Chiński gigant technologiczny Alibaba wprowadził na rynek rodzinę modeli Qwen 3 AI z otwartym kodem źródłowym. Kolekcja obejmuje osiem nowych modeli.
  • Najważniejszy model, Qwen3-235B-A22B MoE, został wytrenowany na 235 miliardach parametrów, przy czym aktywowano 22 miliardy parametrów.
  • Mniejszy model Qwen3-30B-A3B MoE, który obsługuje tylko 3 miliardy parametrów, znacznie przewyższa GPT-4o.

Chiński gigant technologiczny Alibaba wprowadził na rynek osiem nowych modeli sztucznej inteligencji (AI) typu open source w serii Qwen 3. Nowe modele Qwen 3 obejmują dwa modele MoE (Mixture of Experts): Qwen3-235B-A22B i Qwen3-30B-A3B. Qwen3-235B-A22B to największy i wiodący model, z łączną liczbą 235 miliardów parametrów i 22 miliardami włączonych parametrów.

Modele Qwen 3 AI wprowadzone na rynek przez Alibaba

Qwen3-30B-A3B to mniejszy model MoE z łączną liczbą 30 miliardów parametrów i 3 miliardami aktywnych parametrów. Dodatkowo, seria Qwen3 obejmuje sześć gęstych modeli, w tym Qwen3-32B, Qwen3-14B, Qwen3-8B, Qwen3-4B, Qwen3-1.7B i Qwen3-0.6B. Te nowe modele od Alibaby Qwen3 AI dodatkowo wzmacniają pozycję firmy w dziedzinie sztucznej inteligencji.

Wszystkie modele Qwen 3 obsługują hybrydowe tryby myślenia, co oznacza, że ​​są zarówno modelami sztucznej inteligencji opartymi na wnioskowaniu, jak i tradycyjnymi modelami dużego języka (LLM). W trybie myślenia model może rozumować krok po kroku, natomiast w trybie bezmyślnym zapewnia szybkie odpowiedzi. Ta funkcja zwiększa elastyczność modelu w różnych zastosowaniach.

Ponadto, wsparcie Modele Qwen 3 obsługują ponad 119 języków i dialektów z całego świata. Jest to jeden z najbardziej wszechstronnych modeli wielojęzycznych. Co więcej, Alibaba ulepszyła obsługę protokołu Model Context Protocol (MCP) dla modeli Qwen 3, odblokowując dodatkowe możliwości agentów. To ulepszenie pozwala modelom lepiej rozumieć kontekst i podejmować trafniejsze decyzje.

Pod względem wydajności większy model Qwen3-235B-A22B zapewnia konkurencyjne wyniki zgodne z Głębokie wyszukiwanie R1 i Grok 3 Beta i Bliźnięta 2.5 Pro i OpenAI o1. Co ciekawe, mniejszy model Qwen3-30B-A3B, z zaledwie 3 miliardami aktywnych parametrów, przewyższa DeepSeek V3 i model GPT-4o OpenAI. Świadczy to o wysokiej efektywności zasobów i możliwości osiągnięcia znakomitej wydajności przy mniejszym rozmiarze modelu.

Alibaba twierdzi, że modele Qwen 3 dobrze radzą sobie z programowaniem, matematyką, naukami ścisłymi i ogólnymi umiejętnościami. Ogólnie rzecz biorąc, Qwen 3 reprezentuje rodzinę zaawansowanych, wysoce wydajnych modeli AI z Chin. Teraz, dzięki nadchodzącemu DeepSeek R2, Chiny są dobrze przygotowane do konkurowania z zachodnimi laboratoriami AI. Ten rozwój odzwierciedla szybki postęp Chin w dziedzinie AI.

Możliwość dodawania komentarzy nie jest dostępna.