NVIDIAはComputexでNemotron 3 Ultraを発表し、知能ランキングで中国のKimi K2.6に追随する

2026-06-01 22:52:58

Nvidiaは6月1日に台北のComputexでNemotron 3 Ultraを発表した。これは5,500億（5,50 billion）パラメータのオープンウェイトAIモデルで、同社にとってこれまでで最大のオープンAIリリースとなる。CEOのジェンセン・フアンは基調講演の中でモデルを発表し、知能ベンチマークにおいて「米国で最上位」のオープンウェイトモデルだと位置づけた。このリリースはオープンウェイトAI分野での競争を一段と激化させる。そこでは、中国のモデル（Moonshot AIのKimi K2.6など）が、Nvidiaの速度優位にもかかわらず、現在、世界の知能ランキングで首位に立っている。

Nemotron 3 Ultraはインテリジェンス・インデックスで48を獲得

リリース前の評価でNvidiaと提携したArtificial Analysisは、Nemotron 3 Ultraが同社のIntelligence Indexで48を記録したとした。この複合ベンチマークは、推論、コーディング、一般知識、エージェント型のパフォーマンスにまたがる10種類の評価を集約したものだ。スコアによりNemotron 3 Ultraは、米国のオープンウェイトモデルのトップに位置づけられた。GoogleのGemma 4 31B（39）、Nvidia自身のNemotron 3 Super（36）、OpenAIのgpt-oss-120b（33）を上回る。

このモデルは、合計5,500億（550 billion）のパラメータを持つMixture-of-Experts（モエ）アーキテクチャを採用するが、いずれの時点でも有効化されるのは550億（55 billion）のみだ。この設計により、複雑な推論タスクにわたる性能を維持しつつ、運用コストを削減できる。

リリース前のエンドポイントで毎秒300トークン超を提供

Artificial Analysisのテストによれば、Nemotron 3 Ultraはリリース前のDeepInfraエンドポイントで、毎秒300を超える出力トークンを提供した。同じ知能クラスにある中国のモデル――DeepSeek V4 ProとKimi K2.6――は、商用APIを通じて現在50〜100トークン毎秒で動作している。Nvidiaは、このモデルが、同等のオープンウェイト代替案よりも5倍速く動き、コストも30%低いと主張している。

アーキテクチャは、Mamba-2レイヤー、標準的なTransformerの注意機構、そしてMixture-of-Expertsのルーティングを組み合わせている。このモデルは100万トークンのコンテキストウィンドウをサポートし、多トークン予測（MTP）を取り入れている。MTPは、未来のトークンを複数同時に生成し、逐次的ではなく先をまとめて出す。

Kimi K2.6は知能スコア54でオープンウェイトのランキング首位

Moonshot AIのKimi K2.6は、Intelligence Indexスコア54でオープンウェイトモデルの中の最上位にある。Nemotron 3 Ultraより6ポイント上だ。4月にリリースされたKimi K2.6は、全AIモデルの中で世界的に4位に位置し、Anthropic、Google、OpenAIの独自フラッグシップの3点下である。なお独自フラッグシップは57で同点になっている。

中国のオープンソース・モデルは、2024年末の約1.2%から、2025年末には約30%へと、グローバルなオープンモデル利用のシェアを拡大した。これは3月の報告による。

Nemotronファミリーは2023年以降3つのモデルサイズ展開

Nvidiaは2023年11月に初めてNemotronブランドのモデルをリリースし、3世代目は2025年12月に発表された。ファミリーには3つのサイズがある。軽量なタスク向けのNano、中位レンジのエンタープライズ用途向けのSuper、複雑な推論ワークロード向けのUltraだ。3つのモデルはいずれも、Mamba-2レイヤー、Transformerの注意機構、そしてMixture-of-Expertsのルーティングを組み合わせたハイブリッド・アーキテクチャを共有している。

2023年3月にリリースされたNemotron 3 Superは、1,200億（120 billion）パラメータで、Intelligence Indexは36だった。Nemotron 3 Ultraの12ポイント増は、プロダクトライン内での大きな前進を示す。

NvidiaはオープンウェイトAI開発に260億ドルを配分

Nvidiaは、オープンウェイトAI開発に260億ドルを投じるための5年計画を明らかにした。同社は3月に、Mistral AIやPerplexityを含む8つのAIラボから成るNemotron Coalitionを結成し、DGX Cloudのインフラ上でオープンなフロンティアモデルを共同開発する。Nvidiaは、モデルファミリーの次世代にあたるNemotron 4にも取り組んでいると発表した。

6月4日にNvidia APIおよびクラウド提供事業者から出荷

Nemotron 3 Ultraは6月4日に出荷される。モデルの重みは公開されており、学習レシピもリリースされる予定だ。ユーザーは、専用のデータセンター用ハードウェアを必要とせず、NvidiaのAPIまたはクラウド提供事業者経由でモデルにアクセスできる。

FAQ

NvidiaのNemotron 3 Ultraは6月1日にどの知能スコアを達成した？ Nemotron 3 Ultraは、Artificial AnalysisのIntelligence Indexで48を記録し、米国のオープンウェイトモデルとして最高位となった。このベンチマークは、推論、コーディング、一般知識、エージェント型のパフォーマンスをカバーする10種類の評価を集約している。

Nemotron 3 Ultraの速度は中国のモデルと比べてどう？ Nemotron 3 Ultraは、リリース前のDeepInfraエンドポイントで毎秒300トークン超を出力した。一方、中国のモデルであるDeepSeek V4 ProとKimi K2.6は、商用APIを通じて毎秒50〜100トークンで動作している。

NvidiaのNemotron 3 Ultraはいつ利用可能になる？ Nemotron 3 Ultraは6月4日に出荷される。ユーザーは、公開された重みと学習レシピがリリースされる形で、NvidiaのAPIまたはクラウド提供事業者を通じてモデルにアクセスできる。

ソースを表示

免責事項：本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。