Nvidia dévoile Nemotron 3 Ultra à Computex, suit Kimi K2.6 de la Chine dans le classement de l’intelligence

Nvidia a dévoilé Nemotron 3 Ultra le 1er juin à Computex à Taipei, un modèle IA open-weight de 550 milliards de paramètres qui constitue la plus grande sortie IA ouverte de la société à ce jour. Le PDG Jensen Huang a annoncé le modèle lors de son discours d’ouverture, le présentant comme le modèle open-weight américain le mieux classé sur des benchmarks d’intelligence. Le lancement intensifie la concurrence dans le secteur de l’IA open-weight, où des modèles chinois, dont Kimi K2.6 de Moonshot AI, occupent actuellement les premières places mondiales en intelligence malgré les avantages de vitesse de Nvidia.

Nemotron 3 Ultra obtient 48 sur le benchmark de l’Intelligence Index

Artificial Analysis, qui s’est associé à Nvidia pour l’évaluation préalable à la sortie, a placé Nemotron 3 Ultra à 48 sur son Intelligence Index. Le benchmark composite agrège 10 évaluations couvrant le raisonnement, la programmation, la connaissance générale et les performances agentiques. Le score fait de Nemotron 3 Ultra le premier modèle open-weight américain, devant Gemma 4 31B de Google (39), Nemotron 3 Super de Nvidia (36) et gpt-oss-120b d’OpenAI (33).

Le modèle utilise une architecture de type mixture-of-experts avec 550 milliards de paramètres au total, mais n’en active que 55 milliards à tout moment. Cette conception réduit les coûts opérationnels tout en conservant des performances sur des tâches de raisonnement complexes.

Le modèle délivre 300+ tokens par seconde sur l’endpoint en pré-sortie

Nemotron 3 Ultra a fourni plus de 300 tokens de sortie par seconde sur un endpoint DeepInfra en pré-sortie, selon les tests d’Artificial Analysis. Les modèles chinois de la même catégorie d’intelligence — DeepSeek V4 Pro et Kimi K2.6 — fonctionnent actuellement à 50–100 tokens par seconde via leurs API commerciales. Nvidia affirme que le modèle tourne cinq fois plus vite que des alternatives open-weight comparables, avec des coûts inférieurs de 30%.

L’architecture combine des couches Mamba-2, une attention Transformer standard et un routage mixture-of-experts. Le modèle prend en charge une fenêtre de contexte d’1 million de tokens et intègre la prédiction multi-token (MTP), qui génère simultanément plusieurs tokens futurs plutôt que séquentiellement.

Kimi K2.6 mène les classements open-weight avec un score d’intelligence de 54

Kimi K2.6 de Moonshot AI occupe la première place parmi les modèles open-weight avec un score d’Intelligence Index de 54, soit six points de plus que Nemotron 3 Ultra. Lancé en avril, Kimi K2.6 se classe quatrième au niveau mondial parmi tous les modèles IA, à trois points derrière les fleurons propriétaires d’Anthropic, Google et OpenAI, qui sont à égalité à 57.

Les modèles open-source chinois ont augmenté leur part d’utilisation mondiale des open-modèles d’environ 1,2% fin 2024 à environ 30% d’ici fin 2025, comme rapporté en mars.

La famille Nemotron couvre trois tailles de modèles depuis 2023

Nvidia a publié son premier modèle de marque Nemotron en novembre 2023, la troisième génération ayant été annoncée en décembre 2025. La famille comprend trois tailles : Nano pour les tâches légères, Super pour les applications d’entreprise de milieu de gamme, et Ultra pour les charges de travail de raisonnement complexes. Les trois modèles partagent la même architecture hybride combinant des couches Mamba-2, l’attention Transformer et un routage mixture-of-experts.

Nemotron 3 Super, publié en mars avec 120 milliards de paramètres, a obtenu 36 sur l’Intelligence Index. L’augmentation de 12 points de Nemotron 3 Ultra représente une avancée significative au sein de la gamme produit.

Nvidia alloue 26 milliards de dollars au développement d’une IA open-weight

Nvidia a dévoilé un plan quinquennal visant à consacrer 26 milliards de dollars au développement d’une IA open-weight. La société a formé la Nemotron Coalition en mars, un groupe de huit laboratoires IA incluant Mistral AI et Perplexity, pour co-développer des modèles open frontier sur l’infrastructure DGX Cloud. Nvidia a annoncé qu’elle travaille sur Nemotron 4, la prochaine génération de la famille de modèles.

Le modèle est disponible le 4 juin via l’API Nvidia et des fournisseurs cloud

Nemotron 3 Ultra sort le 4 juin. Les poids du modèle sont publics et des recettes d’entraînement sont publiées. Les utilisateurs peuvent accéder au modèle via l’API de Nvidia ou via des fournisseurs cloud, sans nécessiter de matériel de datacenter dédié.

FAQ

Quel score d’intelligence a obtenu Nemotron 3 Ultra de Nvidia le 1er juin ? Nemotron 3 Ultra a obtenu 48 sur l’Artificial Analysis Intelligence Index, ce qui en fait le modèle open-weight américain le mieux classé. Le benchmark agrège 10 évaluations couvrant le raisonnement, la programmation, la connaissance générale et les performances agentiques.

Quelle est la comparaison de la vitesse de Nemotron 3 Ultra avec les modèles chinois ? Nemotron 3 Ultra a délivré plus de 300 tokens de sortie par seconde sur un endpoint DeepInfra en pré-sortie, tandis que les modèles chinois DeepSeek V4 Pro et Kimi K2.6 fonctionnent à 50–100 tokens par seconde via leurs API commerciales.

Quand Nemotron 3 Ultra de Nvidia devient-il disponible ? Nemotron 3 Ultra sort le 4 juin. Les utilisateurs peuvent accéder au modèle via l’API de Nvidia ou via des fournisseurs cloud, avec des poids publics et des recettes d’entraînement publiées.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire