MiniMax 发布 M2 技术报告;Forge 系统实现 40 倍训练提速

据 Beating 称,MiniMax 已在 arXiv 上发布其 M2 技术报告,详细介绍其旗舰 MoE(专家混合,mixture-of-experts)架构以及代理训练系统 Forge。公司披露 Forge 如何通过分块的 FIFO 调度与前缀树合并技术来优化长上下文代理强化学习,实现最高 40x 的训练加速。

M2.7 展示了自主代理自我进化能力,完成了 100 多轮分析、代码修订与测试循环。在性能基准上,M2.7 在 SWE-Pro 上达到 56.22%,在 Multi-SWE-bench 上达到 52.7%;在 MLE Bench 上平均奖励率为 66.6%,接近 Gemini 3.1 的性能水平。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论