Gate News message, April 27 — Alibaba's PAI team has released and open-sourced AgenticQwen, a small-scale agentic language model designed for industrial-grade tool-calling applications. The model comes in two versions: 8B and 30B-A3B. Trained through an innovative "dual data flywheel" reinforcement learning framework, AgenticQwen achieves near-trillion-parameter model-level agentic capabilities while significantly reducing inference costs.

The dual data flywheel mechanism addresses the homogenization problem in traditional synthetic data. The reasoning flywheel automatically generates harder variants from model errors, while the agentic flywheel expands simple linear workflows (such as single booking processes) into multi-branch behavior trees with constraints, rejections, and adversarial conditions, simulating real-world complex decision scenarios. Benchmarks show AgenticQwen-8B scored 47.4 on real tool environment benchmarks (TAU-2 and BFCL-V4), far exceeding the base Qwen3-8B (23.8) and approaching Qwen3-235B (52.0). AgenticQwen-30B-A3B (with only 3B parameters activated) achieved 50.2.

The model has been deployed in internal production systems similar to Manus, significantly narrowing the gap with 235B models in end-to-end inference time. However, the model is limited by a native context length of 40K tokens, which constrains its performance on deep search tasks.

Afficher la source

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

04-27 05:00

L'écosystème FLOA lance la suite IA FloaClaw avec une matrice de compétences multi-scénarios

04-26 09:00

Baidu Qianfan lance l’assistance Day 0 pour DeepSeek-V4 avec des services d’API

04-26 01:29

Alibaba Cloud Lance Qwen-Image-2.0-Pro avec une Génération Texte-Image et une Retouche Unifiées, prenant en charge le rendu de texte multilingue

04-25 01:21

OpenClaw v2026.4.23 Ajoute une prise en charge directe de l’OAuth pour gpt-image-2, et introduit le mode de contexte dérivé pour les sous-agents

04-24 12:31

Une grande CEX lance Agentic Wallet pour les agents IA avec 0 frais pendant la période promotionnelle

Analyse approfondie

DeepSeek V4 Pro sur Ollama Cloud : connectez Claude Code en un clic

ChainNewsAbmedia04-27 06:34

Guo Mingyi : OpenAI veut fabriquer un téléphone avec des agents IA, MediaTek, Qualcomm et Luxshare Precision constituent la chaîne d’approvisionnement clé

ChainNewsAbmedia04-27 06:15

Cloud Tencent QClaw connecte le framework Hermes, prend en charge le basculement entre plusieurs modèles, comme DeepSeek-V4 Pro

Market Whisper04-27 05:26

Commentaire

0/400

Aucun commentaire