
El CEO de Nvidia, Jensen Huang, presentó Nemotron 3 Ultra el 1 de junio en su discurso de apertura en Computex, en Taipéi. Este modelo de pesos abiertos obtuvo una puntuación de índice de inteligencia de 48 en las evaluaciones pre-publicadas de Artificial Analysis y Nvidia, pero quedó por detrás de Kimi K2.6 de Moonshot AI, que alcanzó 54.
Especificaciones técnicas de Nemotron 3 Ultra: ventana de contexto de 550 mil millones de parámetros activos, millones de tokens y envío el 4 de junio
Nemotron 3 Ultra utiliza una arquitectura de Mixture of Experts (MoE): 5.500 millones de parámetros en total, pero en cualquier momento activa solo 55.000 millones de parámetros activos, combinados con Mamba-2, el mecanismo de atención estándar de Transformer y enrutamiento de mezcla de expertos. El modelo admite una ventana de contexto de 1 millón de tokens y emplea la técnica de Predicción Multitoken (MTP) para mejorar la velocidad de generación.
Nvidia indica que, en comparación con otros modelos de pesos abiertos de su categoría, Ultra es 5 veces más rápido en inferencia y tiene un costo 30% menor. En los endpoints de pre-publicación de DeepInfra, el modelo puede procesar más de 300 tokens de salida por segundo; en contraste, DeepSeek V4 Pro y Kimi K2.6 procesan solo entre 50 y 100 tokens por segundo mediante su API comercial. Los pesos del modelo son públicos, el plan de entrenamiento ya se publicó y la fecha de envío oficial es el 4 de junio de 2026.
Comparación directa de índice de inteligencia en IA de código abierto entre Estados Unidos y China: datos de Artificial Analysis
De acuerdo con los datos de evaluación publicados por Artificial Analysis, el ranking del índice de inteligencia para los principales modelos es el siguiente: los principales modelos de código cerrado globales (Anthropic, Google, OpenAI) obtienen 57 puntos; Kimi K2.6 (Moonshot AI, China, lanzado en abril de 2026) obtiene 54 puntos, ocupando el cuarto lugar global; Nemotron 3 Ultra (Nvidia, Estados Unidos) obtiene 48 puntos, siendo el primero de código abierto en Estados Unidos; Google Gemma 4 31B (Estados Unidos) obtiene 39 puntos; Nemotron 3 Super (Nvidia, marzo de 2026, 120B parámetros) obtiene 36 puntos; OpenAI gpt-oss-120b (Estados Unidos) obtiene 33 puntos. El índice de inteligencia es un baremo consolidado de 10 evaluaciones (inferencia, codificación, conocimientos generales, rendimiento de agentes), donde a mayor puntuación, mayor fortaleza.
La alianza Nemotron y Nemotron 4: marco de desarrollo de la próxima generación ya confirmado
Nvidia anunció de manera simultánea en Computex de Taipéi que Nemotron 4 ya está en desarrollo. La alianza Nemotron, formada por Nvidia en marzo de 2026, será la responsable: participan 8 laboratorios de IA, incluidos Mistral AI y Perplexity, desarrollando conjuntamente sobre la infraestructura en la nube DGX.
Nvidia ya había anunciado previamente un plan de inversión en IA de código abierto por 26 mil millones de dólares a lo largo de cinco años; Nemotron 3 Ultra es, hasta el momento, el resultado más representativo. La proporción del uso global de modelos de código abierto chinos ha crecido desde aproximadamente 1,2% a finales de 2024 hasta aproximadamente 30% a finales de 2025 (fuente: Decrypt, marzo de 2026).
Preguntas frecuentes
¿Qué mejoras trae Nemotron 3 Ultra frente a la anterior Nemotron 3 Super?
Nemotron 3 Super se lanzó en marzo de 2026 con 120 mil millones de parámetros y un índice de inteligencia de 36 puntos; el índice de inteligencia de Nemotron 3 Ultra es de 48 puntos, una mejora de 12 puntos año contra año. Nvidia afirma que esos 12 puntos constituyen un salto significativo en el ámbito de las pruebas de referencia.
¿Por qué el índice de inteligencia de Kimi K2.6 es más alto que el de Nvidia Nemotron 3 Ultra?
El índice de inteligencia de Kimi K2.6 de Moonshot AI (China) es de 54 puntos, 6 puntos más que los 48 de Nemotron 3 Ultra. En el ranking global de todos los modelos (incluidos los de código cerrado), Kimi K2.6 ocupa el cuarto lugar, quedando solo 3 puntos por detrás de los modelos insignia de código cerrado de Anthropic, Google y OpenAI (cada uno con 57 puntos). OpenAI, Anthropic y Google tienden a mantener sus modelos más fuertes detrás de APIs, mientras que los laboratorios chinos continúan aportando modelos con puntuaciones altas al ecosistema de código abierto.
¿En qué escenarios es más crucial la ventaja de velocidad de Nemotron 3 Ultra?
Ultra procesa más de 300 tokens de salida por segundo, lo cual es entre tres y seis veces más rápido que las API comerciales de DeepSeek V4 Pro y Kimi K2.6. Nvidia señala que esta ventaja es especialmente importante cuando los agentes autónomos de IA ejecutan tareas de múltiples pasos durante mucho tiempo, porque el tiempo de espera por cada paso se acumula rápidamente en tareas complejas.