Alibaba apresenta Qwen3 uma série de modelos que competem com os líderes do mercado

30 abril, 2025

Com sua nova série Qwen3, a Alibaba se posiciona na vanguarda da inteligência artificial, oferecendo modelos de código aberto que desafiam os líderes do setor.

Alibaba lançou sua série de modelos Qwen3. Esta nova família de modelos não apenas se apresenta como uma alternativa séria aos sistemas mais reconhecidos, mas também obteve resultados em benchmarks que a colocam em pé de igualdade com gigantes como DeepSeek-R1, o1, o3-mini, Grok-3 e Gemini-2.5-Pro.

Entre os modelos destacados estão o Qwen3-235B-A22B e o Qwen3-30B-A3B, ambos com arquitetura Mixture-of-Experts. Esses modelos demonstraram um desempenho impressionante em testes padrão de programação, matemática e capacidades gerais, mesmo sendo menores do que muitos de seus concorrentes. Os dados dos benchmarks sugerem que esses resultados foram alcançados utilizando o modo de raciocínio, aproveitando ao máximo o orçamento de tokens disponível.

A introdução do Qwen3 não apenas representa uma adição à oferta da Alibaba, mas também estabelece um novo padrão no setor. O que torna o Qwen3 tão especial? Sua capacidade de alternar entre diferentes modos de raciocínio é fundamental. No chamado “Modo de Pensamento”, o modelo resolve tarefas com passos intermediários detalhados, enquanto no “Modo Sem Pensamento”, oferece respostas rápidas e diretas. Essa versatilidade é comparável ao que outros modelos como Claude 3.7 e Grok oferecem.

Destaques do Qwen3

A série Qwen3 é composta por modelos híbridos de código aberto, o que significa que foram projetados para serem acessíveis e adaptáveis a diversas aplicações. A Alibaba pré-treinou esses modelos utilizando 36 trilhões de tokens, superando o Llama 4 Maverick (22T), mas ficando abaixo do Llama 4 Scout (40T). Essa ampla base de dados inclui conteúdo da web, documentos e conjuntos de dados personalizados de matemática e programação, o que enriquece sua capacidade de resposta.

Além disso, a Alibaba garante que seus modelos cobrem 119 idiomas e dialetos, permitindo atender a uma variedade impressionante de usuários, desde falantes de inglês e chinês até línguas minoritárias. Essa diversidade linguística é crucial para sua implementação em contextos globais. No entanto, a efetividade real dos modelos dependerá de como serão utilizados em situações específicas.

Os resultados dos benchmarks indicam que a série Qwen3 não apenas é competitiva, mas também supera em tamanho e desempenho concorrentes como a série Llama da Meta e DeepSeek. No entanto, essa vantagem pode ser efêmera, já que a Meta está prestes a apresentar um novo modelo de raciocínio baseado no Llama-4, e a DeepSeek tem um sucessor do R1 a caminho.

Com seu foco em modelos de código aberto e sua arquitetura inovadora, a Alibaba está dando passos firmes no campo da inteligência artificial. O Qwen3 conseguirá manter sua posição diante da crescente concorrência? Só o tempo dirá.

Deixe o primeiro comentário