MiniMax публикует технический отчёт M2; система Forge обеспечивает ускорение обучения в 40 раз

По данным Beating, MiniMax опубликовала свой технический отчёт M2 на arXiv, в котором подробно описала флагманскую архитектуру MoE (mixture-of-experts) и систему обучения агентов Forge. Компания раскрыла, как Forge оптимизирует обучение с подкреплением для агентов с длинным контекстом за счёт оконного FIFO-планирования и техник слияния по префиксному дереву, добиваясь до 40-кратного ускорения обучения.

M2.7 продемонстрировала возможности автономной самоэволюции агентa: она завершила более 100 раундов циклов анализа, пересмотра кода и тестирования. На тестовых бенчмарках M2.7 показала 56,22% на SWE-Pro и 52,7% на Multi-SWE-bench, а также среднюю частоту вознаграждений 66,6% на MLE Bench, приблизившись к уровню производительности Gemini 3.1.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев