Alibaba выпускает открытую модель AgenticQwen: версия 8B приближается к производительности 235B благодаря двойным флайвиллам данных

Сообщение Gate News, 27 апреля — команда PAI компании Alibaba выпустила и открыла исходный код AgenticQwen, небольшую агентную языковую модель, предназначенную для прикладных задач вызова инструментов промышленного уровня. Модель поставляется в двух версиях: 8B и 30B-A3B. Обученная в рамках инновационной фреймворка обучения с подкреплением “двойного флайвилла данных”, AgenticQwen достигает почти агентичных возможностей на уровне модели с триллион параметров, при этом существенно снижая затраты на инференс.

Механизм двойного флайвилла данных решает проблему гомогенизации в традиционных синтетических данных. Флайвилл рассуждений автоматически генерирует более сложные варианты на основе ошибок модели, а агентный флайвилл расширяет простые линейные рабочие процессы (такие как одиночные процессы бронирования) в многоветвистые деревья поведения с ограничениями, отклонениями и противодействующими (адверсариальными) условиями, моделируя реальные сложные сценарии принятия решений. Бенчмарки показывают, что AgenticQwen-8B набрала 47,4 на реальных тестах инструментальной среды (TAU-2 и BFCL-V4), значительно превосходя базовую Qwen3-8B (23,8) и приближаясь к Qwen3-235B (52,0). AgenticQwen-30B-A3B (с задействованием всего 3B параметров) достигла 50,2.

Модель внедрена во внутренние производственные системы, аналогичные Manus, заметно сократив разрыв с моделями 235B по времени сквозного инференса. Однако модель ограничена нативной длиной контекста 40K токенов, что сдерживает ее производительность в задачах глубокого поиска.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Грег Брокман из OpenAI: ИИ смещается от чата к автономному выполнению задач

Gate News-сообщение от 27 апреля — Грег Брокман, президент и сооснователь OpenAI, говорит, что следующая волна искусственного интеллекта переведет пользователей от общения с ИИ-ботами к постановке реальных задач. Этот сдвиг требует от предприятий пересмотреть операционные рабочие процессы и установить новые протоколы для se

GateNews10м назад

Крупный запуск CEX: Smart Money Signal Suite с данными 1 000+ трейдеров

Сообщение Gate News, 27 апреля — Крупная централизованная биржа запустила «Smart Money Signal Suite» (комплект сигналов умных денег), который объединяет данные о текущих активах, процентах побед и прибыли/убытках более чем 1 000 популярных трейдеров в режиме реального времени. Комплект, доступный через Agent Trade Kit платформы, инкапсулирует сигналы трейдеров как инструменты, вызываемые ИИ-агентом.

GateNews21м назад

B.AI обновляет инфраструктуру и запускает крупные функции Skills

Сообщение Gate News, 27 апреля — B.AI объявила о нескольких улучшениях продуктов и экосистемы на этой неделе. Посадочная страница BAIclaw получила полный визуальный и интерактивный редизайн: поддержка многоязычности сайта расширена до 10 языков, что усиливает ее глобальную удобство использования. На инфраструктурном

GateNews24м назад

ИИ-агенты формируют спрос на криптоплатежи, x402 обрабатывает 165 млн транзакций

Сообщение Gate News от 27 апреля — Джесси Поллак, руководитель в крупной CEX, утверждал, что автономные ИИ-агенты создают новый «центр спроса» для криптоплатежей, что требует программно-ориентированной платежной инфраструктуры. 20 апреля было объявлено, что экосистема x402 обработала более 165

GateNews1ч назад

Агент Cursor AI всё испортил! Одна строка кода за 9 секунд очищает базу данных компании, а «безопасная проверка» превратилась в пустые разговоры

Основатель PocketOS Джер Крейн заявил, что агент Cursor AI в тестовой среде выполнял обслуживание самостоятельно, злоупотребив одним API Token для добавления/удаления настраиваемых доменов, и отправил команду на удаление в GraphQL API Railway. За 9 секунд данные и снимки в том же регионе были полностью уничтожены; самое свежее восстановление возможно только до трех месяцев назад. Агент признал нарушения правил по необратимым операциям, не ознакомился с технической документацией, не проверил изоляцию среды и другие требования; пострадавшими стали клиенты арендного бизнеса: бронирования и данные исчезли полностью, а работы по сверке заняли много времени. Крейн предложил пять реформ: ручное подтверждение, детализированные права API, резервное копирование и разделение основных данных, публичный SLA, принудительный механизм на уровне инфраструктуры.

ChainNewsAbmedia1ч назад

DeepSeek V4 Pro в Ollama Cloud: однокнопочное подключение Claude Code

Согласно твитам Ollama, DeepSeek V4 Pro вышла 4/24, и уже размещена в каталоге Ollama в облачном режиме; одной строкой команды можно вызывать такие инструменты, как Claude Code, Hermes, OpenClaw, OpenCode, Codex и т. д. Версия V4 Pro1.6T parameters, 1M context, Mixture-of-Experts; облачный вывод не загружает локальные веса. Чтобы использовать локально, нужно самостоятельно получить веса и запускать с INT4/GGUF и многокарточным GPU. Раннее тестирование по скорости зависело от облачной нагрузки: обычно около 30 tok/s, пиковое значение 1.1 tok/s; рекомендуется сначала использовать облачный прототип, а для серийного производства — выполнять вывод самостоятельно или использовать коммерческий API.

ChainNewsAbmedia2ч назад
комментарий
0/400
Нет комментариев