Prime Intellect открывает исходный код среды для самоэволюционирующего агента, генерирует 8 000+ инструментов и повышает точность использования инструментов до 52,3%

По данным Beating, Prime Intellect опубликовала в открытый доступ общее агентное решение (general-agent) — самовозобновляющуюся среду для обучения агентов, которая использует механики генерации задач с участием двух игроков. Система автоматически сгенерировала 4 504 задачи и более 8 000 уникальных инструментов, чередуя генератор задач и решатель, а также распределяя вызовы по пяти уровням сложности с помощью девяти стратегий, включая условия-ограничения, зашумленные инструкции и связку между сущностями.

В тестировании дообучение модели с 30 млрд параметров на 4 400+ траекториях из среды улучшило точность вызова инструментов с 18,9% до 52,3% на бенчмарке BFCL, продемонстрировав способность этой схемы генерировать семантически верифицированные обучающие данные без опоры на вручную размеченные статические датасеты.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев