Сообщение Gate News, 27 апреля — команда PAI компании Alibaba выпустила и открыла исходный код AgenticQwen, небольшую агентную языковую модель, предназначенную для прикладных задач вызова инструментов промышленного уровня. Модель поставляется в двух версиях: 8B и 30B-A3B. Обученная в рамках инновационной фреймворка обучения с подкреплением "двойного флайвилла данных", AgenticQwen достигает почти агентичных возможностей на уровне модели с триллион параметров, при этом существенно снижая затраты на инференс.

Механизм двойного флайвилла данных решает проблему гомогенизации в традиционных синтетических данных. Флайвилл рассуждений автоматически генерирует более сложные варианты на основе ошибок модели, а агентный флайвилл расширяет простые линейные рабочие процессы (такие как одиночные процессы бронирования) в многоветвистые деревья поведения с ограничениями, отклонениями и противодействующими (адверсариальными) условиями, моделируя реальные сложные сценарии принятия решений. Бенчмарки показывают, что AgenticQwen-8B набрала 47,4 на реальных тестах инструментальной среды (TAU-2 и BFCL-V4), значительно превосходя базовую Qwen3-8B (23,8) и приближаясь к Qwen3-235B (52,0). AgenticQwen-30B-A3B (с задействованием всего 3B параметров) достигла 50,2.

Модель внедрена во внутренние производственные системы, аналогичные Manus, заметно сократив разрыв с моделями 235B по времени сквозного инференса. Однако модель ограничена нативной длиной контекста 40K токенов, что сдерживает ее производительность в задачах глубокого поиска.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

04-27 05:00

Экосистема FLOA запускает комплект ИИ FloaClaw с многостадийной матрицей навыков

04-26 09:00

Baidu Qianfan запускает поддержку Day 0 для DeepSeek-V4 с API-сервисами

04-26 01:29

Alibaba Cloud запускает Qwen-Image-2.0-Pro с единым преобразованием текста в изображение и редактированием, поддержкой многоязычного отображения текста

04-25 01:21

OpenClaw v2026.4.23 Добавляет поддержку прямого OAuth для gpt-image-2, представляет режим с форкнутым контекстом для субагентов

04-24 12:31

Крупный запуск CEX-кошелька: Agentic Wallet для AI-агентов с нулевыми комиссиями в период промо

Детальный анализ

DeepSeek V4 Pro в Ollama Cloud: однокнопочное подключение Claude Code

ChainNewsAbmedia04-27 06:34

Го Минь-цин: OpenAI собирается сделать AI-агент для смартфонов, MediaTek, Qualcomm и Luxshare Precision становятся ключевыми элементами цепочки поставок

ChainNewsAbmedia04-27 06:15

Облачная платформа Tencent Cloud QClaw подключается к фреймворку Hermes, поддерживает переключение между несколькими моделями, включая DeepSeek-V4 Pro

Market Whisper04-27 05:26

комментарий

0/400

Нет комментариев