Chińska firma Alibaba wyprzedza Meta dzięki nowym modelom sztucznej inteligencji Qwen 3
Abstrakcyjny:
- Chiński gigant technologiczny Alibaba wprowadził na rynek rodzinę modeli Qwen 3 AI z otwartym kodem źródłowym. Kolekcja obejmuje osiem nowych modeli.
- Najważniejszy model, Qwen3-235B-A22B MoE, został wytrenowany na 235 miliardach parametrów, przy czym aktywowano 22 miliardy parametrów.
- Mniejszy model Qwen3-30B-A3B MoE, który obsługuje tylko 3 miliardy parametrów, znacznie przewyższa GPT-4o.
Chiński gigant technologiczny Alibaba wprowadził na rynek osiem nowych modeli sztucznej inteligencji (AI) typu open source w serii Qwen 3. Nowe modele Qwen 3 obejmują dwa modele MoE (Mixture of Experts): Qwen3-235B-A22B i Qwen3-30B-A3B. Qwen3-235B-A22B to największy i wiodący model, z łączną liczbą 235 miliardów parametrów i 22 miliardami włączonych parametrów.

Qwen3-30B-A3B to mniejszy model MoE z łączną liczbą 30 miliardów parametrów i 3 miliardami aktywnych parametrów. Dodatkowo, seria Qwen3 obejmuje sześć gęstych modeli, w tym Qwen3-32B, Qwen3-14B, Qwen3-8B, Qwen3-4B, Qwen3-1.7B i Qwen3-0.6B. Te nowe modele od Alibaby Qwen3 AI dodatkowo wzmacniają pozycję firmy w dziedzinie sztucznej inteligencji.
Przedstawiamy Qwen3!
Udostępniamy Qwen3 w wersji open-weight, nasze najnowsze modele dużych języków, w tym 2 modele MoE i 6 modeli gęstych, o rozmiarach od 0.6B do 235B. Nasz flagowy model, Qwen3-235B-A22B, osiąga konkurencyjne wyniki w testach porównawczych kodowania, matematyki, ogólnych… pic.twitter.com/JWZkJeHWhC
— Qwen (@Alibaba_Qwen) 28 kwietnia 2025 r.
Wszystkie modele Qwen 3 obsługują hybrydowe tryby myślenia, co oznacza, że są zarówno modelami sztucznej inteligencji opartymi na wnioskowaniu, jak i tradycyjnymi modelami dużego języka (LLM). W trybie myślenia model może rozumować krok po kroku, natomiast w trybie bezmyślnym zapewnia szybkie odpowiedzi. Ta funkcja zwiększa elastyczność modelu w różnych zastosowaniach.
Ponadto, wsparcie Modele Qwen 3 obsługują ponad 119 języków i dialektów z całego świata. Jest to jeden z najbardziej wszechstronnych modeli wielojęzycznych. Co więcej, Alibaba ulepszyła obsługę protokołu Model Context Protocol (MCP) dla modeli Qwen 3, odblokowując dodatkowe możliwości agentów. To ulepszenie pozwala modelom lepiej rozumieć kontekst i podejmować trafniejsze decyzje.
Pod względem wydajności większy model Qwen3-235B-A22B zapewnia konkurencyjne wyniki zgodne z Głębokie wyszukiwanie R1 i Grok 3 Beta i Bliźnięta 2.5 Pro i OpenAI o1. Co ciekawe, mniejszy model Qwen3-30B-A3B, z zaledwie 3 miliardami aktywnych parametrów, przewyższa DeepSeek V3 i model GPT-4o OpenAI. Świadczy to o wysokiej efektywności zasobów i możliwości osiągnięcia znakomitej wydajności przy mniejszym rozmiarze modelu.
Alibaba twierdzi, że modele Qwen 3 dobrze radzą sobie z programowaniem, matematyką, naukami ścisłymi i ogólnymi umiejętnościami. Ogólnie rzecz biorąc, Qwen 3 reprezentuje rodzinę zaawansowanych, wysoce wydajnych modeli AI z Chin. Teraz, dzięki nadchodzącemu DeepSeek R2, Chiny są dobrze przygotowane do konkurowania z zachodnimi laboratoriami AI. Ten rozwój odzwierciedla szybki postęp Chin w dziedzinie AI.
Możliwość dodawania komentarzy nie jest dostępna.