Mensagem da Gate News, 27 de abril — A equipe da PAI da Alibaba lançou e disponibilizou em código aberto o AgenticQwen, um modelo de linguagem agentic de pequena escala projetado para aplicações industriais de chamada de ferramentas. O modelo vem em duas versões: 8B e 30B-A3B. Treinado por meio de uma inovadora estrutura de aprendizado por reforço “dual data flywheel”, o AgenticQwen alcança capacidades agentic no nível de modelos próximos a um trilhão de parâmetros, reduzindo significativamente os custos de inferência.
O mecanismo do dual data flywheel aborda o problema de homogeneização nos dados sintéticos tradicionais. O flywheel de raciocínio gera automaticamente variantes mais difíceis a partir dos erros do modelo, enquanto o flywheel agentic expande fluxos de trabalho lineares simples (como processos de reserva única) em árvores de comportamento com múltiplos ramos, com restrições, rejeições e condições adversariais, simulando cenários complexos de decisão do mundo real. Benchmarks mostram que o AgenticQwen-8B marcou 47,4 em benchmarks reais de ambiente de ferramentas (TAU-2 e BFCL-V4), superando de longe o Qwen3-8B base (23,8) e se aproximando do Qwen3-235B (52,0). O AgenticQwen-30B-A3B (com apenas 3B parâmetros ativados) alcançou 50,2.
O modelo foi implantado em sistemas internos de produção semelhantes ao Manus, reduzindo significativamente a diferença em relação aos modelos de 235B no tempo de inferência ponta a ponta. No entanto, o modelo é limitado por um comprimento de contexto nativo de 40K tokens, o que restringe seu desempenho em tarefas de busca profunda.
Related News
DeepSeek V4 Pro no Ollama Cloud: Claude Code em um clique
Guo Mingqián: A OpenAI vai fazer um celular com agentes de IA; MediaTek, Qualcomm e Luxshare Precision se tornam uma cadeia de suprimentos fundamental
Nuvem Tencent QClaw integra a estrutura Hermes, suportando a troca entre vários modelos, como o DeepSeek-V4 Pro