Nvidia presenta Nemotron 3 Ultra en Computex y sigue a la Kimi K2.6 de China en los rankings de inteligencia

2026-06-01 22:52:58

Nvidia presentó Nemotron 3 Ultra el 1 de junio en Computex en Taipéi, un modelo de IA open-weight con 550 mil millones de parámetros que marca el mayor lanzamiento de IA abierta de la empresa hasta la fecha. El CEO Jensen Huang anunció el modelo durante su discurso de apertura, posicionándolo como el modelo open-weight de mayor rango de EE. UU. en benchmarks de inteligencia. El lanzamiento intensifica la competencia en el espacio de IA open-weight, donde los modelos chinos, incluidos Kimi K2.6 de Moonshot AI, actualmente lideran los rankings globales de inteligencia pese a las ventajas de velocidad de Nvidia.

Nemotron 3 Ultra obtiene 48 en el benchmark del Índice de Inteligencia

Artificial Analysis, que se asoció con Nvidia para la evaluación previa al lanzamiento, ubicó a Nemotron 3 Ultra en 48 en su Índice de Inteligencia. El benchmark compuesto agrega 10 evaluaciones que abarcan razonamiento, programación, conocimiento general y desempeño agentico. La puntuación establece a Nemotron 3 Ultra como el modelo open-weight de EE. UU. mejor clasificado, superando a Gemma 4 31B de Google con 39, a Nemotron 3 Super de Nvidia con 36, y a gpt-oss-120b de OpenAI con 33.

El modelo utiliza una arquitectura de mezcla de expertos con 550 mil millones de parámetros totales, pero activa solo 55 mil millones en un momento dado. Este diseño reduce los costos operativos mientras mantiene el rendimiento en tareas complejas de razonamiento.

El modelo entrega 300+ tokens por segundo en el endpoint previo al lanzamiento

Nemotron 3 Ultra sirvió más de 300 tokens de salida por segundo en un endpoint de DeepInfra previo al lanzamiento, según las pruebas de Artificial Analysis. Los modelos chinos en la misma clase de inteligencia—DeepSeek V4 Pro y Kimi K2.6—actualmente operan a 50–100 tokens por segundo a través de sus API comerciales. Nvidia afirma que el modelo funciona cinco veces más rápido que alternativas open-weight comparables con costos 30% más bajos.

La arquitectura combina capas de Mamba-2, atención estándar tipo Transformer y enrutamiento de mezcla de expertos. El modelo admite una ventana de contexto de 1 millón de tokens e incorpora predicción de múltiples tokens (MTP), que genera varios tokens futuros simultáneamente en lugar de forma secuencial.

Kimi K2.6 lidera los rankings open-weight con 54 puntos de inteligencia

Kimi K2.6 de Moonshot AI mantiene la posición principal entre los modelos open-weight con una puntuación de Índice de Inteligencia de 54, seis puntos por encima de Nemotron 3 Ultra. Lanzado en abril, Kimi K2.6 ocupa el cuarto lugar a nivel global entre todos los modelos de IA, con tres puntos de diferencia respecto a las marcas propias de Anthropic, Google y OpenAI, que empatan en 57.

Los modelos open-source chinos incrementaron su participación en el uso global de open-model desde aproximadamente 1,2% a finales de 2024 hasta alrededor de 30% para finales de 2025, según se informó en marzo.

La familia Nemotron abarca tres tamaños de modelos desde 2023

Nvidia lanzó su primer modelo con marca Nemotron en noviembre de 2023, y la tercera generación se anunció en diciembre de 2025. La familia incluye tres tamaños: Nano para tareas ligeras, Super para aplicaciones empresariales de gama media y Ultra para cargas de trabajo de razonamiento complejas. Los tres modelos comparten la arquitectura híbrida que combina capas de Mamba-2, atención Transformer y enrutamiento de mezcla de expertos.

Nemotron 3 Super, lanzado en marzo con 120 mil millones de parámetros, obtuvo 36 en el Índice de Inteligencia. El aumento de 12 puntos de Nemotron 3 Ultra representa un avance significativo dentro de la línea de productos.

Nvidia asigna 26 mil millones de dólares al desarrollo de IA open-weight

Nvidia divulgó un plan de cinco años para gastar 26 mil millones de dólares en el desarrollo de IA open-weight. La empresa formó la Nemotron Coalition en marzo, un grupo de ocho labs de IA que incluye Mistral AI y Perplexity, para co-desarrollar modelos open frontier en la infraestructura DGX Cloud. Nvidia anunció que está trabajando en Nemotron 4, la siguiente generación dentro de la familia de modelos.

El modelo sale el 4 de junio mediante la API de Nvidia y proveedores cloud

Nemotron 3 Ultra sale el 4 de junio. Los pesos del modelo son públicos y las recetas de entrenamiento se están publicando. Los usuarios pueden acceder al modelo a través de la API de Nvidia o proveedores de cloud sin requerir hardware dedicado de centro de datos.

FAQ

¿Qué puntuación de inteligencia logró Nemotron 3 Ultra de Nvidia el 1 de junio?
Nemotron 3 Ultra obtuvo 48 en el Artificial Analysis Intelligence Index, lo que lo convierte en el modelo open-weight de EE. UU. mejor clasificado. El benchmark agrega 10 evaluaciones que cubren razonamiento, programación, conocimiento general y desempeño agentico.

¿Cómo se compara la velocidad de Nemotron 3 Ultra con los modelos chinos?
Nemotron 3 Ultra entregó más de 300 tokens de salida por segundo en un endpoint de DeepInfra previo al lanzamiento, mientras que los modelos chinos DeepSeek V4 Pro y Kimi K2.6 operan a 50–100 tokens por segundo a través de sus API comerciales.

¿Cuándo estará disponible Nemotron 3 Ultra de Nvidia?
Nemotron 3 Ultra sale el 4 de junio. Los usuarios pueden acceder al modelo a través de la API de Nvidia o proveedores de cloud, con pesos públicos y recetas de entrenamiento que se están publicando.

Ver fuente

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.

Noticias relacionadas

hace1h

Nvidia presenta Nemotron 3 Ultra, el modelo estadounidense líder, pero queda por debajo del Kimi K2.6 de China

hace14h

Nvidia lanza el chip para PC RTX Spark, Vera CPU en producción completa el 1 de junio

hace19h

Nvidia presenta una nueva generación de modelos de IA para robótica