GPT 5.6 Sol, Terra, Luna guia rápido: características, preços de uma vez, comparando com Claude, qual é a melhor?

A OpenAI lançou a série de modelos GPT-5.6. Este artigo mostra as características, preços e taxas de API das famílias de modelos Sol, Terra e Luna. No entanto, devido aos requisitos de revisão de segurança do governo Trump, atualmente está disponível apenas para parceiros selecionados em pré-visualização limitada.

Lançamento relâmpago do GPT-5.6, acesso restrito devido a exigências do governo Trump

A OpenAI surpreendeu ao lançar a nova série de modelos GPT-5.6 em 26 de junho, que inclui o modelo principal Sol, o modelo equilibrado Terra e o modelo de alto custo-benefício Luna.

No entanto, devido às exigências de revisão de segurança do governo Trump para modelos de IA de ponta, a OpenAI atualmente oferece uma prévia limitada apenas a um pequeno número de parceiros de confiança, e não está disponível no ChatGPT por enquanto, com abertura gradual no futuro. Apesar disso, o lançamento repentino do GPT-5.6, prévia da OpenAI, Sol, Terra e Luna se tornou uma palavra-chave de busca popular no mundo da tecnologia.

Diferenças entre os três modelos do GPT-5.6: Sol, Terra, Luna

A série GPT-5.6 fez uma grande mudança no sistema de nomenclatura, abandonando nomes comuns como nano ou mini. A OpenAI afirma que os números no novo sistema de nomenclatura representam a geração do modelo, enquanto Sol, Terra e Luna representam níveis de capacidade de desenvolvimento independente e duradouro, com o objetivo de oferecer escolhas mais claras para empresas e desenvolvedores entre inteligência, velocidade e custo.

Embora para os entusiastas de criptomoedas, Sol lembre facilmente a blockchain Layer 1 Solana ($SOL), e Terra e Luna lembrem o projeto Terra ($LUNA) que foi a zero, esses três modelos não têm relação alguma com blockchain ou criptomoedas. Sol em latim significa sol, Terra significa Terra e Luna significa Lua.

Esses três modelos são projetados para diferentes necessidades empresariais:

  • Sol é a opção principal de mais alto nível, construída para as tarefas mais desafiadoras, como raciocínio complexo, codificação avançada, fluxos de trabalho orientados por agentes inteligentes e defesa de segurança cibernética.
  • Terra equilibra desempenho poderoso e eficiência, adequado para ambientes de produção que precisam lidar com grandes volumes de trabalho (como suporte ao cliente, ferramentas internas e análise de documentos) e desejam controlar custos.
  • Luna é a opção mais leve e de melhor custo-benefício da família, otimizada para velocidade e tarefas rotineiras de automação.

Preços do GPT-5.6 Sol, Terra, Luna: diferenças nas taxas de API

Em termos de preços, o GPT-5.6 é cobrado por 1 milhão de tokens com base nos três tamanhos de modelo. A tabela abaixo mostra os preços e posicionamentos detalhados (em dispositivos móveis, deslize a tabela para a esquerda/direita):

| Modelo | Posicionamento | Entrada por 1M tokens | Saída por 1M tokens | | --- | --- | --- | --- | | GPT-5.6 Sol | Modelo principal, adequado para raciocínio avançado, agentes, pesquisa de segurança | US$ 5 | US$ 30 | | GPT-5.6 Terra | Modelo empresarial equilibrado | US$ 2,5 | US$ 15 | | GPT-5.6 Luna | Modelo de alta eficiência e baixo custo | US$ 1 | US$ 6 |

Comparação de preços de API do GPT-5.6 com Claude, Gemini, Grok e outros

Além de divulgar os preços da série GPT-5.6, o VentureBeat também organizou os preços de API dos principais modelos de linguagem de grande escala (LLM) atuais.

No mercado geral, o GPT-5.6 Luna está posicionado na faixa de preço médio-baixo, com entrada de US$ 1 por 1M de tokens e saída de US$ 6, totalizando cerca de US$ 7, situando-se entre o GLM-5.2 e o Grok 4.3 (Low Context).

Para maior capacidade de raciocínio, o custo total do GPT-5.6 Terra é de cerca de US$ 17,5, igual ao GPT-5.4; o modelo principal GPT-5.6 Sol mantém o mesmo preço do GPT-5.5, com entrada de US$ 5 por 1M de tokens e saída de US$ 30, totalizando cerca de US$ 35, abaixo dos US$ 60 do mais recente Claude Fable 5/Claude Mythos 5 da Anthropic.

Comparação de preços de API de modelos de IA mainstream (por 1M de tokens), compilado pelo veículo estrangeiro VentureBeat

| Modelo | Entrada | Saída | Custo total | | --- | --- | --- | --- | | MiMo-V2.5 Flash | US$ 0,10 | US$ 0,30 | US$ 0,40 | | DeepSeek V4 Flash | US$ 0,14 | US$ 0,28 | US$ 0,42 | | DeepSeek V4 Pro | US$ 0,435 | US$ 0,87 | US$ 1,305 | | MiniMax M3 | US$ 0,30 | US$ 1,20 | US$ 1,50 | | Gemini 3.1 Flash Lite | US$ 0,25 | US$ 1,50 | US$ 1,75 | | Qwen3.7 Plus | US$ 0,40 | US$ 1,60 | US$ 2,00 | | MiMo-V2.5 | US$ 0,40 | US$ 2,00 | US$ 2,40 | | Grok 4.3 (Low Context) | US$ 1,25 | US$ 2,50 | US$ 3,75 | | MiMo-V2.5 Pro (≤256K) | US$ 1,00 | US$ 3,00 | US$ 4,00 | | Kimi-K2.6 | US$ 0,95 | US$ 4,00 | US$ 4,95 | | GLM-5.2 | US$ 1,40 | US$ 4,40 | US$ 5,80 | | GPT-5.6 Luna | US$ 1,00 | US$ 6,00 | US$ 7,00 | | Grok 4.3 (High Context) | US$ 2,50 | US$ 5,00 | US$ 7,50 | | MiMo-V2.5 Pro (>256K) | US$ 2,00 | US$ 6,00 | US$ 8,00 | | Qwen3.7 Max | US$ 2,50 | US$ 7,50 | US$ 10,00 | | Gemini 3.5 Flash | US$ 1,50 | US$ 9,00 | US$ 10,50 | | Gemini 3.1 Pro Preview (≤200K) | US$ 2,00 | US$ 12,00 | US$ 14,00 | | GPT-5.6 Terra | US$ 2,50 | US$ 15,00 | US$ 17,50 | | GPT-5.4 | US$ 2,50 | US$ 15,00 | US$ 17,50 | | Gemini 3.1 Pro Preview (>200K) | US$ 4,00 | US$ 18,00 | US$ 22,00 | | Claude Opus 4.8 | US$ 5,00 | US$ 25,00 | US$ 30,00 | | GPT-5.5 | US$ 5,00 | US$ 30,00 | US$ 35,00 | | GPT-5.5 Instant | US$ 5,00 | US$ 30,00 | US$ 35,00 | | Sakana Fugu Ultra | US$ 5,00 | US$ 30,00 | US$ 35,00 | | GPT-5.6 Sol | US$ 5,00 | US$ 30,00 | US$ 35,00 | | Claude Fable 5/Claude Mythos 5 | US$ 10,00 | US$ 50,00 | US$ 60,00 |

Desta vez, a OpenAI adotou os nomes Sol, Terra e Luna, facilitando para as empresas escolherem o modelo com base na capacidade, velocidade e custo, em vez de usar o tamanho do modelo como critério.

Nova tecnologia do GPT-5.6: Raciocínio mais profundo e colaboração com subagentes

Além da melhoria na capacidade dos modelos, o GPT-5.6 também introduziu um novo modo de raciocínio. De acordo com o conteúdo divulgado pela OpenAI, o Sol adicionou o modo Max Reasoning, permitindo que o modelo dedique mais tempo de raciocínio para melhorar a qualidade da conclusão de tarefas complexas.

Ao mesmo tempo, a OpenAI também lançou o modo Ultra, que utiliza múltiplos subagentes (Subagent) trabalhando em conjunto para lidar com tarefas grandes, em vez de um único agente fazer todo o trabalho, aumentando a eficiência em projetos grandes e fluxos de trabalho longos.

Este design é voltado principalmente para fluxos de trabalho de agentes empresariais. Ao dividir tarefas complexas para vários subagentes processarem em conjunto, pode melhorar a eficiência de raciocínio de longo prazo, desenvolvimento de código e execução de grandes projetos. Esta é uma das principais diferenças entre o GPT-5.6 e o GPT-5.5.

Benchmarks melhoram em todas as áreas, TerminalBench atinge novo recorde

De acordo com os resultados de testes divulgados pela OpenAI, o GPT-5.6 Sol alcançou o melhor resultado até o momento no teste de fluxo de trabalho de linha de comando TerminalBench 2.1, superando o GPT-5.5 e também modelos concorrentes como o Claude Mythos 5.

Além disso, no teste de pesquisa biológica GeneBench, o GPT-5.6 Sol obteve melhores resultados que o GPT-5.5 usando menos tokens.

A partir de vários testes, pode-se observar que o Sol supera o GPT-5.5 em benchmarks como Agent's Last Exam, TerminalBench e ExploitBench, enquanto o Terra também supera o modelo principal da geração anterior em muitos testes de fluxo de trabalho. O Luna, mantendo o baixo custo, ainda oferece desempenho próximo ao GPT-5.5.

Atualização do mecanismo de Prompt Cache, Cerebras fornecerá até 750 tokens/segundo

A OpenAI atualizou simultaneamente o mecanismo de Prompt Cache, adicionando Cache Breakpoint explícito e fornecendo pelo menos 30 minutos de tempo de retenção de cache. A empresa afirma que a gravação em cache será cobrada a 1,25 vezes o preço de entrada sem cache, enquanto a leitura em cache mantém 90% de desconto, permitindo que as empresas controlem mais facilmente os custos de token em fluxos de trabalho de agentes.

Por outro lado, a OpenAI também anunciou que o GPT-5.6 Sol estará disponível na plataforma Cerebras em julho deste ano, com velocidade de inferência de até 750 tokens por segundo, visando principalmente aplicações empresariais de grande escala que exigem baixa latência e alto desempenho.

Para fluxos de trabalho repetitivos em grande escala, o novo mecanismo de cache combinado com inferência de alta velocidade pode reduzir os custos gerais de computação.

Aplicações empresariais mais fortes, mas com segurança aprimorada

A OpenAI afirma que a série GPT-5.6 adota a arquitetura de segurança multicamadas mais completa atualmente, incluindo mecanismos de rejeição em nível de modelo, classificadores em tempo real de segurança biológica e cibernética, análise de risco em nível de conta e testes contínuos de equipe vermelha, visando equilibrar as necessidades de defesa de segurança cibernética e reduzir usos maliciosos.

A empresa afirma que o GPT-5.6 Sol é mais hábil em ajudar a encontrar vulnerabilidades e corrigir falhas, mas ainda não atingiu o nível Cyber Critical necessário para realizar um ataque completo de forma autônoma.

A OpenAI investiu cerca de 700 mil horas de GPU A100 em testes automatizados de equipe vermelha para o GPT-5.6, além de adicionar detecção de risco em tempo real, Activation Classifier e revisão de segurança durante a inferência. No entanto, como a pesquisa de segurança cibernética tem uso duplo, a OpenAI também admite que alguns trabalhos legítimos ainda podem ser afetados pelas verificações de segurança.

Lançamento faseado do GPT-5.6 reflete nova direção na governança de IA

A prévia limitada do GPT-5.6 também se tornou um caso importante na governança recente de IA.

De acordo com a OpenAI, antes do lançamento oficial, a empresa já havia explicado ao governo dos EUA as capacidades do modelo e os planos de lançamento, e, de acordo com as exigências governamentais, primeiro forneceu testes para um pequeno número de parceiros de confiança, antes de expandir gradualmente.

A OpenAI afirma que espera que essa abordagem de revisão governamental prévia seja apenas uma medida transitória, e ainda espera que desenvolvedores, empresas e usuários comuns tenham acesso mais amplo aos modelos mais recentes no futuro.

De acordo com o Decrypt, o lançamento restrito também está relacionado ao recente estabelecimento pelo governo dos EUA de uma estrutura de avaliação para modelos de IA de nova geração. Após as restrições ao Claude Mythos 5 e Claude Fable 5 da Anthropic, o GPT-5.6 se tornou o segundo modelo de IA de ponta a ser afetado pelo processo de lançamento do governo dos EUA.

Com base na situação recente das duas gigantes, no futuro, a revisão de segurança governamental, a governança corporativa e a avaliação de capacidade dos modelos podem gradualmente se tornar parte do processo de lançamento de grandes modelos de IA.

  • **Reportagem relacionada: **Claude Fable 5 banido e removido! Conselheiro da Casa Branca revela os motivos internos da proibição, Yann LeCun critica que estão colhendo o que plantaram
SOL5,86%
LUNA1,75%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Fixado