英伟达发布美国最强开源 AI,智商指数 48 落后于 Kimi 模型

輝達開源AI

英伟达(NVIDIA)执行长黄仁勋于 6 月 1 日在台北电脑展(Computex)主题演讲中发布 Nemotron 3 Ultra,这款开放式权重模型在 Artificial Analysis 与英伟达联合预发布评估中获得智慧指数 48 分,但输给中国 Moonshot AI 的 Kimi K2.6,后者 54 分。

Nemotron 3 Ultra 技术规格:550 亿活跃参数、百万 Token 上下文窗口与 6 月 4 日出货

Nemotron 3 Ultra 采用混合专家(MoE)架构:总参数 5,500 亿,任意时刻仅激活其中 550 亿个活跃参数,结合 Mamba-2 层、标准 Transformer 注意力机制和混合专家路由。模型支持 100 万个 token 的上下文窗口,并采用多词元预测(MTP)技术提升生成速度。

英伟达表示,与同类开放式权重模型相比,Ultra 的推理速度快 5 倍,成本低 30%。在 DeepInfra 预发布端点上,该模型每秒可处理超过 300 个输出 token;相比之下,DeepSeek V4 Pro 和 Kimi K2.6 通过商业 API 每秒仅处理 50 至 100 个 token。模型权重公开,训练方案已发布,正式出货日期为 2026 年 6 月 4 日。

美国与中国开源 AI 智慧指数直接比较:Artificial Analysis 数据

根据 Artificial Analysis 发布的评估数据,主要模型的智慧指数排名如下:全球闭源旗舰模型(Anthropic、Google、OpenAI)均为 57 分;Kimi K2.6(Moonshot AI,中国,2026 年 4 月发布)54 分,全球排名第四;Nemotron 3 Ultra(英伟达,美国)48 分,美国开源第一;Google Gemma 4 31B(美国)39 分;Nemotron 3 Super(英伟达,2026 年 3 月,120B 参数)36 分;OpenAI gpt-oss-120b(美国)33 分。智慧指数为汇总 10 项评估(推理、编码、一般知识、智能体性能)的综合基准,分数越高代表越强。

Nemotron 联盟与 Nemotron 4:已确认的下一代开发框架

英伟达于台北电脑展同步宣布,Nemotron 4 已在开发中,由英伟达于 2026 年 3 月组建的 Nemotron 联盟负责,成员包括 Mistral AI 和 Perplexity 在内的 8 个 AI 实验室,基于 DGX 云端基础设施共同开发。

英伟达此前已公开宣布五年 260 亿美元的开源 AI 投资计划,Nemotron 3 Ultra 是截至目前最具代表性的成果。中国开源模型的全球开源使用量占比已从 2024 年底的约 1.2% 增长至 2025 年底的约 30%(来源:Decrypt,2026 年 3 月报道)。

常见问题

Nemotron 3 Ultra 与上一代 Nemotron 3 Super 相比有何提升?

Nemotron 3 Super 于 2026 年 3 月发布,拥有 1,200 亿个参数,智慧指数 36 分;Nemotron 3 Ultra 的智慧指数为 48 分,同比提升 12 分。英伟达表示,12 分的提升在基准测试领域属于显著跃升。

Kimi K2.6 的智慧指数为何高于英伟达 Nemotron 3 Ultra?

中国 Moonshot AI 的 Kimi K2.6 智慧指数 54 分,比 Nemotron 3 Ultra 的 48 分高出 6 分,在全球所有模型(含闭源)中排名第四,仅落后于 Anthropic、Google 和 OpenAI 旗舰闭源模型(各 57 分)3 分。美国 OpenAI、Anthropic 和 Google 倾向于将最强模型保留在 API 背后,而中国实验室则持续向开源生态系统贡献高分模型。

Nemotron 3 Ultra 的速度优势在哪些场景中最为关键?

Ultra 每秒处理超过 300 个输出 token,比 DeepSeek V4 Pro 和 Kimi K2.6 的商业 API 速度快三至六倍。英伟达指出,这一优势在自主 AI 代理执行长时间多步骤任务时尤为重要,因为每步等待时间会在复杂任务中快速累积。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论