
O CEO da NVIDIA, Jensen Huang, lançou o Nemotron 3 Ultra em 1º de junho, durante o discurso de abertura na Computex em Taipei. Este modelo de pesos abertos obteve 48 pontos no Índice de Inteligência em uma avaliação prévia conjunta entre Artificial Analysis e a NVIDIA, mas ficou atrás do Kimi K2.6, da chinesa Moonshot AI, que marcou 54 pontos.
Especificações técnicas do Nemotron 3 Ultra: 55 bilhões de parâmetros ativos, janela de contexto de milhão de tokens e envio em 4 de junho
O Nemotron 3 Ultra utiliza uma arquitetura de Especialistas Mistos (MoE): são 550 bilhões de parâmetros no total, com apenas 55 bilhões de parâmetros ativos ativados a qualquer momento, combinando camadas Mamba-2, o mecanismo de atenção padrão do Transformer e roteamento de especialistas mistos. O modelo suporta uma janela de contexto de 1 milhão de tokens e adota a técnica de predição de múltiplos tokens (MTP) para aumentar a velocidade de geração.
A NVIDIA afirma que, em comparação com outros modelos de pesos abertos do mesmo tipo, o Ultra tem velocidade de inferência 5 vezes maior e custo 30% menor. Nos endpoints em pré-lançamento da DeepInfra, o modelo pode processar mais de 300 tokens de saída por segundo; em contraste, o DeepSeek V4 Pro e o Kimi K2.6 processam apenas de 50 a 100 tokens por segundo via API comercial. Os pesos do modelo foram disponibilizados, a estratégia de treinamento foi publicada e a data oficial de envio é 4 de junho de 2026.
Comparação direta do Índice de Inteligência de IA de código aberto entre EUA e China: dados da Artificial Analysis
Com base nos dados de avaliação divulgados pela Artificial Analysis, o ranking de Índice de Inteligência dos principais modelos é o seguinte: os modelos carro-chefe fechados globais (Anthropic, Google, OpenAI) ficaram com 57 pontos; Kimi K2.6 (Moonshot AI, China, lançado em abril de 2026) marcou 54 pontos, ficando em quarto lugar global; Nemotron 3 Ultra (NVIDIA, EUA) marcou 48 pontos, ficando em primeiro lugar entre os abertos nos EUA; Google Gemma 4 31B (EUA) marcou 39 pontos; Nemotron 3 Super (NVIDIA, março de 2026, parâmetros de 120B) marcou 36 pontos; OpenAI gpt-oss-120b (EUA) marcou 33 pontos. O Índice de Inteligência é uma referência consolidada de 10 avaliações (inferência, codificação, conhecimento geral, desempenho de agentes), e quanto maior a pontuação, mais forte o desempenho.
A aliança Nemotron e o Nemotron 4: quadro de desenvolvimento da próxima geração confirmado
A NVIDIA anunciou simultaneamente na Computex que o Nemotron 4 já está em desenvolvimento. O responsável é a aliança Nemotron, formada pela NVIDIA em março de 2026, com 8 laboratórios de IA, incluindo Mistral AI e Perplexity, que desenvolvem em conjunto com base na infraestrutura de nuvem DGX.
A NVIDIA já havia divulgado antes um plano de investimento em IA de código aberto de 26 bilhões de dólares ao longo de 5 anos, e o Nemotron 3 Ultra é, até o momento, o resultado mais representativo. A parcela de uso global dos modelos abertos chineses cresceu de cerca de 1,2% no fim de 2024 para cerca de 30% no fim de 2025 (fonte: Decrypt, reportagem de março de 2026).
Perguntas frequentes
Em que o Nemotron 3 Ultra melhora em relação ao antecessor Nemotron 3 Super?
O Nemotron 3 Super foi lançado em março de 2026, com 120 bilhões de parâmetros e Índice de Inteligência de 36 pontos; o Nemotron 3 Ultra tem Índice de Inteligência de 48 pontos, um ganho de 12 pontos ano contra ano. A NVIDIA afirma que a melhora de 12 pontos, em testes de referência, representa um salto significativo.
Por que o Índice de Inteligência do Kimi K2.6 é maior do que o do Nemotron 3 Ultra da NVIDIA?
O Kimi K2.6 da chinesa Moonshot AI tem 54 pontos no Índice de Inteligência, 6 pontos acima dos 48 pontos do Nemotron 3 Ultra. Ele ocupa o quarto lugar entre todos os modelos globais (incluindo os fechados), ficando atrás apenas dos modelos carro-chefe fechados da Anthropic, Google e OpenAI (cada um com 57 pontos), por uma diferença de 3 pontos. Laboratórios dos EUA como OpenAI, Anthropic e Google tendem a manter os modelos mais fortes atrás de APIs, enquanto laboratórios chineses continuam a contribuir com modelos de alta pontuação para o ecossistema de código aberto.
Em quais cenários a vantagem de velocidade do Nemotron 3 Ultra é mais crucial?
O Ultra processa mais de 300 tokens de saída por segundo, ou seja, é cerca de 3 a 6 vezes mais rápido do que o DeepSeek V4 Pro e o Kimi K2.6 nas APIs comerciais. A NVIDIA aponta que essa vantagem é especialmente importante quando agentes de IA autônomos executam tarefas de múltiplos passos por longos períodos, pois o tempo de espera de cada passo se acumula rapidamente em tarefas complexas.