OpenClaw 创始人分享 AI 模型适配率排名,国产 minimax-m2.1 和 kimi-k2.5 分列 2、3 位

Gate News 消息,3 月 8 日,OpenClaw(AI 代理开发框架)创始人 Peter Steinberger 转发第三方机构 PinchBench 基准测试结果,该测试评估 AI 大语言模型在 OpenClaw 代理任务中的表现。结果显示,Gemini 3 Flash 处理 OpenClaw 任务成功率以 95.1% 位居第一,国产模型 minimax-m2.1 和 kimi-k2.5 分别以 93.6% 和 93.4% 分列第 2、3 位。Claude Sonnet 4.5 成功率为 92.7%,GPT-4o 为 85.2%。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论