英伟达发布美国最强开源 AI，智商指数 48 落后于 Kimi 模型

2026-06-02 03:28:58

英伟达（NVIDIA）执行长黄仁勋于 6 月 1 日在台北电脑展（Computex）主题演讲中发布 Nemotron 3 Ultra，这款开放式权重模型在 Artificial Analysis 与英伟达联合预发布评估中获得智慧指数 48 分，但输给中国 Moonshot AI 的 Kimi K2.6，后者 54 分。

Nemotron 3 Ultra 技术规格：550 亿活跃参数、百万 Token 上下文窗口与 6 月 4 日出货

Nemotron 3 Ultra 采用混合专家（MoE）架构：总参数 5,500 亿，任意时刻仅激活其中 550 亿个活跃参数，结合 Mamba-2 层、标准 Transformer 注意力机制和混合专家路由。模型支持 100 万个 token 的上下文窗口，并采用多词元预测（MTP）技术提升生成速度。

英伟达表示，与同类开放式权重模型相比，Ultra 的推理速度快 5 倍，成本低 30%。在 DeepInfra 预发布端点上，该模型每秒可处理超过 300 个输出 token；相比之下，DeepSeek V4 Pro 和 Kimi K2.6 通过商业 API 每秒仅处理 50 至 100 个 token。模型权重公开，训练方案已发布，正式出货日期为 2026 年 6 月 4 日。

美国与中国开源 AI 智慧指数直接比较：Artificial Analysis 数据

根据 Artificial Analysis 发布的评估数据，主要模型的智慧指数排名如下：全球闭源旗舰模型（Anthropic、Google、OpenAI）均为 57 分；Kimi K2.6（Moonshot AI，中国，2026 年 4 月发布）54 分，全球排名第四；Nemotron 3 Ultra（英伟达，美国）48 分，美国开源第一；Google Gemma 4 31B（美国）39 分；Nemotron 3 Super（英伟达，2026 年 3 月，120B 参数）36 分；OpenAI gpt-oss-120b（美国）33 分。智慧指数为汇总 10 项评估（推理、编码、一般知识、智能体性能）的综合基准，分数越高代表越强。

Nemotron 联盟与 Nemotron 4：已确认的下一代开发框架

英伟达于台北电脑展同步宣布，Nemotron 4 已在开发中，由英伟达于 2026 年 3 月组建的 Nemotron 联盟负责，成员包括 Mistral AI 和 Perplexity 在内的 8 个 AI 实验室，基于 DGX 云端基础设施共同开发。

英伟达此前已公开宣布五年 260 亿美元的开源 AI 投资计划，Nemotron 3 Ultra 是截至目前最具代表性的成果。中国开源模型的全球开源使用量占比已从 2024 年底的约 1.2% 增长至 2025 年底的约 30%（来源：Decrypt，2026 年 3 月报道）。

常见问题

Nemotron 3 Ultra 与上一代 Nemotron 3 Super 相比有何提升？

Nemotron 3 Super 于 2026 年 3 月发布，拥有 1,200 亿个参数，智慧指数 36 分；Nemotron 3 Ultra 的智慧指数为 48 分，同比提升 12 分。英伟达表示，12 分的提升在基准测试领域属于显著跃升。

Kimi K2.6 的智慧指数为何高于英伟达 Nemotron 3 Ultra？

中国 Moonshot AI 的 Kimi K2.6 智慧指数 54 分，比 Nemotron 3 Ultra 的 48 分高出 6 分，在全球所有模型（含闭源）中排名第四，仅落后于 Anthropic、Google 和 OpenAI 旗舰闭源模型（各 57 分）3 分。美国 OpenAI、Anthropic 和 Google 倾向于将最强模型保留在 API 背后，而中国实验室则持续向开源生态系统贡献高分模型。

Nemotron 3 Ultra 的速度优势在哪些场景中最为关键？

Ultra 每秒处理超过 300 个输出 token，比 DeepSeek V4 Pro 和 Kimi K2.6 的商业 API 速度快三至六倍。英伟达指出，这一优势在自主 AI 代理执行长时间多步骤任务时尤为重要，因为每步等待时间会在复杂任务中快速累积。

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。