Alibaba ha llançat la seva sèrie de models Qwen3. Aquesta nova família de models no només es presenta com una alternativa seriosa als sistemes més reconeguts, sinó que ha aconseguit resultats en benchmarks que la situen a l’altura de gegants com DeepSeek-R1, o1, o3-mini, Grok-3 i Gemini-2.5-Pro.
Entre els models destacats es troben el Qwen3-235B-A22B i el Qwen3-30B-A3B, ambdós amb arquitectura Mixture-of-Experts. Aquests models han demostrat un rendiment impressionant en proves estàndard de programació, matemàtiques i capacitats generals, fins i tot sent més petits que molts dels seus competidors. Les dades dels benchmarks suggereixen que aquests resultats s’han aconseguit utilitzant el mode de raonament, aprofitant al màxim el pressupost de tokens disponible.
La introducció de Qwen3 no només representa una addició a l’oferta d’Alibaba, sinó que també estableix un nou estàndard en el sector. Què fa a Qwen3 tan especial? La seva capacitat d’alternar entre diferents modes de raonament és clau. En el conegut «Mode de Pensament», el model resol tasques amb passos intermedis detallats, mentre que en el «Mode Sense Pensament», ofereix respostes ràpides i directes. Aquesta versatilitat és comparable a el que ofereixen altres models com Claude 3.7 i Grok.
Característiques destacades de Qwen3
La sèrie Qwen3 es compon de models híbrids de codi obert, la qual cosa significa que estan dissenyats per ser accessibles i adaptables a diverses aplicacions. Alibaba ha preentrenat aquests models utilitzant 36 bilions de tokens, superant a Llama 4 Maverick (22T) però quedant per sota de Llama 4 Scout (40T). Aquesta àmplia base de dades inclou contingut web, documents i conjunts de dades personalitzats de matemàtiques i programació, la qual cosa enriqueix la seva capacitat de resposta.
A més, Alibaba assegura que els seus models cobreixen 119 idiomes i dialectes, la qual cosa els permet atendre una varietat impressionant d’usuaris, des de parlants d’anglès i xinès fins a llengües minoritàries. Aquesta diversitat lingüística és crucial per a la seva implementació en contextos globals. No obstant això, l’efectivitat real dels models dependrà de com s’utilitzin en situacions específiques.
Els resultats dels benchmarks indiquen que la sèrie Qwen3 no només és competitiva, sinó que també supera en mida i rendiment a competidors com la sèrie Llama de Meta i DeepSeek. No obstant això, aquest avantatge podria ser efímer, ja que Meta està a punt de presentar un nou model de raonament basat en Llama-4, i DeepSeek té un successor del R1 en camí.
Amb el seu enfocament en models de codi obert i la seva innovadora arquitectura, Alibaba està donant passos ferms en el camp de la intel·ligència artificial. Conseguirà Qwen3 mantenir la seva posició davant la creixent competència? Només el temps ho dirà.