Повідомлення Gate News, 27 квітня — команда PAI в Alibaba випустила та відкрито розмістила AgenticQwen, компактну агентну мовну модель, призначену для промислових застосувань викликів інструментів. Модель представлено у двох версіях: 8B та 30B-A3B. Навчена за допомогою інноваційної рамки підкріплювального навчання “двійної прогінної передачі даних”, AgenticQwen досягає можливостей рівня агентів майже трильйонопараметричної моделі, водночас суттєво знижуючи витрати на інференс.
Механізм двійної прогінної передачі даних вирішує проблему гомогенізації в традиційних синтетичних даних. Прогінна передача міркувань автоматично генерує складніші варіанти на основі помилок моделі, тоді як агентна прогінна передача розширює прості лінійні робочі процеси (такі як процеси одиночного бронювання) у багатовіткові дерева поведінки з обмеженнями, відмовами та зловмисними умовами, імітуючи реальні складні сценарії прийняття рішень. Бенчмарки показують, що AgenticQwen-8B набрала 47,4 на реальних бенчмарках середовища для інструментів (TAU-2 та BFCL-V4), що значно перевищує базову Qwen3-8B (23,8) і наближається до Qwen3-235B (52,0). AgenticQwen-30B-A3B (із активованими лише 3B параметрами) досягла 50,2.
Модель розгорнули в внутрішніх виробничих системах, подібних до Manus, що суттєво звужує розрив із моделями 235B за часом наскрізного інференсу. Однак модель обмежена власною довжиною контексту 40K токенів, що звужує її продуктивність у задачах глибокого пошуку.
Related News
DeepSeek V4 Pro на Ollama Cloud: Claude Code одним кліком
Го Мінцзун: OpenAI хоче створити мобільний телефон з AI-агентом, MediaTek, Qualcomm і Luxshare Precision стають ключовими ланками ланцюга постачання
Хмарне середовище Tencent Cloud QClaw інтегрує фреймворк Hermes, підтримує перемикання між кількома моделями, зокрема DeepSeek-V4 Pro