Mensagem da Gate News, 27 de abril — A equipe da PAI da Alibaba lançou e disponibilizou em código aberto o AgenticQwen, um modelo de linguagem agentic de pequena escala projetado para aplicações industriais de chamada de ferramentas. O modelo vem em duas versões: 8B e 30B-A3B. Treinado por meio de uma inovadora estrutura de aprendizado por reforço "dual data flywheel", o AgenticQwen alcança capacidades agentic no nível de modelos próximos a um trilhão de parâmetros, reduzindo significativamente os custos de inferência.

O mecanismo do dual data flywheel aborda o problema de homogeneização nos dados sintéticos tradicionais. O flywheel de raciocínio gera automaticamente variantes mais difíceis a partir dos erros do modelo, enquanto o flywheel agentic expande fluxos de trabalho lineares simples (como processos de reserva única) em árvores de comportamento com múltiplos ramos, com restrições, rejeições e condições adversariais, simulando cenários complexos de decisão do mundo real. Benchmarks mostram que o AgenticQwen-8B marcou 47,4 em benchmarks reais de ambiente de ferramentas (TAU-2 e BFCL-V4), superando de longe o Qwen3-8B base (23,8) e se aproximando do Qwen3-235B (52,0). O AgenticQwen-30B-A3B (com apenas 3B parâmetros ativados) alcançou 50,2.

O modelo foi implantado em sistemas internos de produção semelhantes ao Manus, reduzindo significativamente a diferença em relação aos modelos de 235B no tempo de inferência ponta a ponta. No entanto, o modelo é limitado por um comprimento de contexto nativo de 40K tokens, o que restringe seu desempenho em tarefas de busca profunda.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

04-27 05:00

Ecossistema FLOA lança suíte de IA FloaClaw com matriz de habilidades multi-cenários

04-26 09:00

Baidu Qianfan Lança Suporte ao Dia 0 para DeepSeek-V4 com Serviços de API

04-26 01:29

Alibaba Cloud lança Qwen-Image-2.0-Pro com texto para imagem e edição unificados, com suporte a renderização de texto multilíngue

04-25 01:21

OpenClaw v2026.4.23 Adiciona Suporte Direto a OAuth do gpt-image-2, Introduz o Modo de Contexto Forked para Subagentes

04-24 12:31

Principal Carteira de CEX Lança Agentic Wallet para Agentes de IA com Zero Taxas Durante Período Promocional

Análise aprofundada

DeepSeek V4 Pro no Ollama Cloud: Claude Code em um clique

ChainNewsAbmedia04-27 06:34

Guo Mingqián: A OpenAI vai fazer um celular com agentes de IA; MediaTek, Qualcomm e Luxshare Precision se tornam uma cadeia de suprimentos fundamental

ChainNewsAbmedia04-27 06:15

Nuvem Tencent QClaw integra a estrutura Hermes, suportando a troca entre vários modelos, como o DeepSeek-V4 Pro

Market Whisper04-27 05:26

Comentário

0/400

Sem comentários