Mensagem da Gate News, 27 de abril — A equipa PAI da Alibaba lançou e disponibilizou em open-source o AgenticQwen, um modelo de linguagem agentico de pequena escala concebido para aplicações industriais de tool-calling. O modelo existe em duas versões: 8B e 30B-A3B. Treinado através de um inovador framework de aprendizagem por reforço “dual data flywheel”, o AgenticQwen atinge capacidades agenticas a nível de modelos próximas de um trilião de parâmetros, reduzindo significativamente os custos de inferência.
O mecanismo dual data flywheel resolve o problema de homogeneização em dados sintéticos tradicionais. O reasoning flywheel gera automaticamente variantes mais difíceis a partir de erros do modelo, enquanto o agentic flywheel expande workflows lineares simples (como processos de reserva única) para comportamento em árvores com múltiplos ramos com restrições, rejeições e condições adversariais, simulando cenários reais complexos de tomada de decisão. Os benchmarks mostram que o AgenticQwen-8B obteve 47,4 em benchmarks de ambientes reais de ferramentas (TAU-2 e BFCL-V4), muito acima do Qwen3-8B base (23,8) e aproximando o Qwen3-235B (52,0). O AgenticQwen-30B-A3B (com apenas 3B parâmetros ativados) obteve 50,2.
O modelo foi implementado em sistemas de produção internos semelhantes ao Manus, reduzindo significativamente a distância face aos modelos de 235B no tempo de inferência ponta a ponta. No entanto, o modelo é limitado por um comprimento de contexto nativo de 40K tokens, o que condiciona o desempenho em tarefas de pesquisa profunda.
Related News
DeepSeek V4 Pro no Ollama Cloud: ligação num só clique do Claude Code
Guo Mingqiang: A OpenAI vai fazer um telemóvel com um agente de IA, MediaTek, Qualcomm e Luxshare Precision são uma cadeia de fornecimento chave
A Tencent Cloud integra o framework Hermes com o QClaw, suportando a alternância entre vários modelos, como o DeepSeek-V4 Pro