NVIDIA lança o mais poderoso AI de código aberto dos EUA, índice de inteligência 48 atrás do modelo Kimi

2026-06-02 03:28:58

O CEO da NVIDIA, Jensen Huang, lançou o Nemotron 3 Ultra em 1º de junho, durante o discurso de abertura na Computex em Taipei. Este modelo de pesos abertos obteve 48 pontos no Índice de Inteligência em uma avaliação prévia conjunta entre Artificial Analysis e a NVIDIA, mas ficou atrás do Kimi K2.6, da chinesa Moonshot AI, que marcou 54 pontos.

Especificações técnicas do Nemotron 3 Ultra: 55 bilhões de parâmetros ativos, janela de contexto de milhão de tokens e envio em 4 de junho

O Nemotron 3 Ultra utiliza uma arquitetura de Especialistas Mistos (MoE): são 550 bilhões de parâmetros no total, com apenas 55 bilhões de parâmetros ativos ativados a qualquer momento, combinando camadas Mamba-2, o mecanismo de atenção padrão do Transformer e roteamento de especialistas mistos. O modelo suporta uma janela de contexto de 1 milhão de tokens e adota a técnica de predição de múltiplos tokens (MTP) para aumentar a velocidade de geração.

A NVIDIA afirma que, em comparação com outros modelos de pesos abertos do mesmo tipo, o Ultra tem velocidade de inferência 5 vezes maior e custo 30% menor. Nos endpoints em pré-lançamento da DeepInfra, o modelo pode processar mais de 300 tokens de saída por segundo; em contraste, o DeepSeek V4 Pro e o Kimi K2.6 processam apenas de 50 a 100 tokens por segundo via API comercial. Os pesos do modelo foram disponibilizados, a estratégia de treinamento foi publicada e a data oficial de envio é 4 de junho de 2026.

Comparação direta do Índice de Inteligência de IA de código aberto entre EUA e China: dados da Artificial Analysis

Com base nos dados de avaliação divulgados pela Artificial Analysis, o ranking de Índice de Inteligência dos principais modelos é o seguinte: os modelos carro-chefe fechados globais (Anthropic, Google, OpenAI) ficaram com 57 pontos; Kimi K2.6 (Moonshot AI, China, lançado em abril de 2026) marcou 54 pontos, ficando em quarto lugar global; Nemotron 3 Ultra (NVIDIA, EUA) marcou 48 pontos, ficando em primeiro lugar entre os abertos nos EUA; Google Gemma 4 31B (EUA) marcou 39 pontos; Nemotron 3 Super (NVIDIA, março de 2026, parâmetros de 120B) marcou 36 pontos; OpenAI gpt-oss-120b (EUA) marcou 33 pontos. O Índice de Inteligência é uma referência consolidada de 10 avaliações (inferência, codificação, conhecimento geral, desempenho de agentes), e quanto maior a pontuação, mais forte o desempenho.

A aliança Nemotron e o Nemotron 4: quadro de desenvolvimento da próxima geração confirmado

A NVIDIA anunciou simultaneamente na Computex que o Nemotron 4 já está em desenvolvimento. O responsável é a aliança Nemotron, formada pela NVIDIA em março de 2026, com 8 laboratórios de IA, incluindo Mistral AI e Perplexity, que desenvolvem em conjunto com base na infraestrutura de nuvem DGX.

A NVIDIA já havia divulgado antes um plano de investimento em IA de código aberto de 26 bilhões de dólares ao longo de 5 anos, e o Nemotron 3 Ultra é, até o momento, o resultado mais representativo. A parcela de uso global dos modelos abertos chineses cresceu de cerca de 1,2% no fim de 2024 para cerca de 30% no fim de 2025 (fonte: Decrypt, reportagem de março de 2026).

Perguntas frequentes

Em que o Nemotron 3 Ultra melhora em relação ao antecessor Nemotron 3 Super?

O Nemotron 3 Super foi lançado em março de 2026, com 120 bilhões de parâmetros e Índice de Inteligência de 36 pontos; o Nemotron 3 Ultra tem Índice de Inteligência de 48 pontos, um ganho de 12 pontos ano contra ano. A NVIDIA afirma que a melhora de 12 pontos, em testes de referência, representa um salto significativo.

Por que o Índice de Inteligência do Kimi K2.6 é maior do que o do Nemotron 3 Ultra da NVIDIA?

O Kimi K2.6 da chinesa Moonshot AI tem 54 pontos no Índice de Inteligência, 6 pontos acima dos 48 pontos do Nemotron 3 Ultra. Ele ocupa o quarto lugar entre todos os modelos globais (incluindo os fechados), ficando atrás apenas dos modelos carro-chefe fechados da Anthropic, Google e OpenAI (cada um com 57 pontos), por uma diferença de 3 pontos. Laboratórios dos EUA como OpenAI, Anthropic e Google tendem a manter os modelos mais fortes atrás de APIs, enquanto laboratórios chineses continuam a contribuir com modelos de alta pontuação para o ecossistema de código aberto.

Em quais cenários a vantagem de velocidade do Nemotron 3 Ultra é mais crucial?

O Ultra processa mais de 300 tokens de saída por segundo, ou seja, é cerca de 3 a 6 vezes mais rápido do que o DeepSeek V4 Pro e o Kimi K2.6 nas APIs comerciais. A NVIDIA aponta que essa vantagem é especialmente importante quando agentes de IA autônomos executam tarefas de múltiplos passos por longos períodos, pois o tempo de espera de cada passo se acumula rapidamente em tarefas complexas.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

06-02 00:49

O processador Nvidia Vera de 88 núcleos será usado pela Anthropic, OpenAI e SpaceX; produção em escala total no 3T

06-02 00:01

MiniMax revela o modelo de codificação M3 com capacidade de 100 milhões de tokens, processamento 5x mais rápido em 1º de junho

06-01 22:51

A Nvidia lança o Nemotron 3 Ultra, modelo número 1 dos EUA no Open, mas fica abaixo do Kimi K2.6, da China

Os detalhes da marca Dragonfly da Qualcomm foram adiados para 24 de junho, e a ação pré-mercado caiu mais de 8%

Market Whisper06-02 02:33

黃仁勳 nega a teoria de que a IA vai causar desemprego; 孫正義: a escala atual é 50 vezes maior do que a bolha da internet

Market Whisper06-02 02:04

A Nvidia revela o Nemotron 3 Ultra na Computex, acompanhando o Kimi K2.6 da China nas classificações de inteligência

Oliver Grant06-01 22:52

A NVIDIA lança o chip para PC RTX Spark e a CPU Vera na COMPUTEX 2026

Oliver Grant06-01 09:24

A NVIDIA lança a plataforma “NVIDIA DSX”, oferecendo uma solução completa para criar fábricas de IA

Market Whisper06-01 05:12

Comentário

0/400

Sem comentários