A NVIDIA lança a IA open source mais forte dos EUA, com um índice de inteligência 48 abaixo do modelo Kimi

輝達開源AI

O CEO da NVIDIA, Huang Renxun, divulgou o Nemotron 3 Ultra a 1 de junho, durante a keynote no Computex em Taipei. O modelo de pesos abertos obteve uma pontuação de 48 no Smart Index nas avaliações pré-publicadas conjuntas da Artificial Analysis e da NVIDIA, mas ficou aquém do Kimi K2.6 da chinesa Moonshot AI, que marcou 54.

Especificações técnicas do Nemotron 3 Ultra: janela de contexto com 100 milhões de tokens, 55 mil milhões de parâmetros ativos e envio a 4 de junho

O Nemotron 3 Ultra utiliza uma arquitetura de Mixture of Experts (MoE): um total de 5.500 mil milhões de parâmetros, com apenas 550 mil milhões deles ativados em qualquer momento, combinando camadas Mamba-2, o mecanismo de atenção padrão do Transformer e o roteamento por especialistas. O modelo suporta uma janela de contexto de 1 milhão de tokens e recorre à técnica de Multi-Token Prediction (MTP) para melhorar a velocidade de geração.

A NVIDIA afirma que, em comparação com outros modelos de pesos abertos da mesma categoria, o Ultra tem uma velocidade de inferência 5 vezes superior e um custo 30% mais baixo. Nos endpoints em pré-lançamento da DeepInfra, este modelo consegue processar mais de 300 tokens de saída por segundo; em comparação, o DeepSeek V4 Pro e o Kimi K2.6 processam apenas 50 a 100 tokens por segundo através de API comercial. Os pesos do modelo são disponibilizados publicamente, o plano de treino já foi publicado e a data oficial de envio é 4 de junho de 2026.

Comparação direta do Smart Index de IA open source: EUA vs China — dados da Artificial Analysis

De acordo com os dados de avaliação publicados pela Artificial Analysis, a classificação do Smart Index dos principais modelos é a seguinte: os principais modelos fechados globais (Anthropic, Google e OpenAI) obtêm 57 pontos; Kimi K2.6 (Moonshot AI, China, lançado em abril de 2026) marcou 54 pontos, ficando em 4.º lugar a nível global; Nemotron 3 Ultra (NVIDIA, EUA) obteve 48 pontos e é o 1.º do open source nos EUA; Google Gemma 4 31B (EUA) marcou 39 pontos; Nemotron 3 Super (NVIDIA, 3.º mês de 2026, 120B de parâmetros) obteve 36 pontos; OpenAI gpt-oss-120b (EUA) marcou 33 pontos. O Smart Index agrega uma base composta por 10 itens de avaliação (inferência, codificação, conhecimentos gerais e desempenho de agentes), sendo que quanto maior a pontuação, mais forte é o modelo.

A Aliança Nemotron e o Nemotron 4: quadro de desenvolvimento da próxima geração já confirmado

A NVIDIA anunciou em simultâneo, no Computex, que o Nemotron 4 já está em desenvolvimento, sendo responsável a Aliança Nemotron, criada em março de 2026 pela própria NVIDIA. Os membros incluem 8 laboratórios de IA, entre os quais Mistral AI e Perplexity, e o desenvolvimento é feito em conjunto com base na infraestrutura de cloud DGX.

A NVIDIA já tinha divulgado previamente um plano de investimento em IA open source de 26 mil milhões de dólares ao longo de cinco anos, e o Nemotron 3 Ultra é, até ao momento, o resultado mais representativo. A quota de utilização global de modelos open source chineses aumentou de cerca de 1,2% no final de 2024 para cerca de 30% no final de 2025 (fonte: Decrypt, reportado em março de 2026).

Perguntas frequentes

Que melhorias existem no Nemotron 3 Ultra face ao Nemotron 3 Super da geração anterior?

O Nemotron 3 Super foi lançado em março de 2026, com 120 mil milhões de parâmetros e um Smart Index de 36 pontos; o Nemotron 3 Ultra tem um Smart Index de 48 pontos, o que representa um aumento de 12 pontos ano contra ano. A NVIDIA afirma que os 12 pontos de melhoria, nos testes de referência, constituem um salto significativo.

Porque é que o Smart Index do Kimi K2.6 é superior ao do Nemotron 3 Ultra da NVIDIA?

O Smart Index do Kimi K2.6 da Moonshot AI chinesa é de 54 pontos, ou seja, 6 pontos acima dos 48 do Nemotron 3 Ultra. Em todos os modelos a nível global (incluindo os fechados), fica em 4.º lugar, apenas atrás dos modelos fechados de topo da Anthropic, Google e OpenAI (cada um com 57 pontos), por 3 pontos. A OpenAI, a Anthropic e a Google dos EUA tendem a manter os modelos mais fortes por trás das APIs, enquanto os laboratórios chineses continuam a contribuir, para o ecossistema open source, com modelos de pontuação elevada.

Em que cenários é que a vantagem de velocidade do Nemotron 3 Ultra é mais crítica?

O Ultra processa mais de 300 tokens de saída por segundo, o que é aproximadamente entre 3 e 6 vezes mais rápido do que as APIs comerciais do DeepSeek V4 Pro e do Kimi K2.6. A NVIDIA sublinha que esta vantagem é especialmente importante em tarefas longas e multi-etapa executadas por agentes autónomos de IA, porque o tempo de espera por cada passo vai-se acumulando rapidamente em tarefas complexas.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário