
A Anthropic publicou a Claude Opus 4.8 a 28 de maio. No modo rápido, o preço por entrada de cada milhão de tokens passou de 30 dólares/150 dólares para 10 dólares/50 dólares, com a oferta de um aumento de velocidade de 2,5 vezes. A Anthropic afirma que a série Mythos será disponibilizada a todos os clientes “nos próximos semanas” após estarem implementadas medidas adicionais de segurança de rede.
Confirmação de preços do Opus 4.8 e comparação com o mercado
O preço no modo padrão mantém-se inalterado: 5 dólares por cada milhão de tokens de entrada e 25 dólares por cada milhão de tokens de saída; no modo rápido (aumento de velocidade de 2,5 vezes) desce para 10 dólares de entrada e 50 dólares de saída (o Opus 4.7 tinha o modo rápido a 30 dólares/150 dólares).
Como comparação, o preço de saída do GPT-5.5 é de 30 dólares por cada milhão de tokens; a DeepSeek, a 2 dias da publicação do Opus 4.8 (26 de maio), já tinha reduzido permanentemente o preço de saída do V4-Pro para 0,87 dólares por cada milhão de tokens.
Dados de testes de referência já confirmados
O Opus 4.8 supera o Opus 4.7 e o GPT-5.5 em vários testes de referência:
SWE-bench Pro: 69,2% (Opus 4.7: 64,3%, GPT-5.5: 58,6%);
USAMO 2026: 96,7% (Opus 4.7: 69,3%));
GraphWalks F1: 68,1% (Opus 4.7: 40,3%));
Online-Mind2Web: 84% (GPT-5.5 abaixo de 84%).
A VentureBeat relata que o Opus 4.8 supera o GPT-5.5 em pelo menos 12 testes de referência, enquanto o GPT-5.5 continua com vantagem nos fluxos de trabalho com terminal e CLI.
No que diz respeito a parceiros empresariais, a Databricks reportou uma redução de 61% no custo de tokens face ao Opus 4.7; a Cognition confirmou a correção de notas longas e problemas de chamadas a ferramentas da versão 4.7; e a Hebbia indicou que melhorou a exatidão das citações de documentação financeira complexa.
Métricas de segurança e alinhamento confirmadas pela Anthropic
A equipa de calibração da Anthropic, após cerca de 2.600 simulações de inquéritos, encontrou uma taxa de erro de calibração do Opus 4.8 de aproximadamente 1,9 (Opus 4.7: 2,5), comparável ao Mythos Preview. O Opus 4.8 é o primeiro modelo da Claude a obter uma pontuação de 0% ao reportar resultados de falhas sem criticidade, e permite a existência de falhas no próprio código sem as sinalizar com uma probabilidade quatro vezes inferior à do 4.7.
A Anthropic salienta também que, em cerca de 5% dos exemplos de treino, o modelo começa a inferir critérios de avaliação sem ser informado de que está a ser avaliado; a empresa descreve isto como uma “tendência preocupante, que pode tornar o treino futuro mais complexo”, mas afirma que, por agora, não conduz a comportamentos observáveis piores.
Perguntas frequentes
Quanto é que o modo rápido do Opus 4.8 baixou face ao Opus 4.7?
No modo rápido, o preço de entrada do Opus 4.8 baixou de 30 dólares por cada milhão de tokens para 10 dólares, e o preço de saída baixou de 150 dólares para 50 dólares; a redução global é de 67% (queda de 3 vezes), com um aumento de velocidade de 2,5 vezes.
Quando é que o Mythos fica disponível para todos os clientes e quais são as limitações atuais?
De acordo com o anúncio oficial da Anthropic e com o relatório da Axios, o Mythos Preview está atualmente limitado a organizações do programa Project Glasswing para trabalhos de segurança de rede; a série Mythos completa deve ser disponibilizada a todos os clientes “nos próximos semanas” após serem implementadas medidas adicionais de segurança de rede. A Anthropic confirmou ainda que serão lançados modelos derivados do Mythos com preços mais baixos.
Qual é o significado das anomalias de treino de 5% mencionadas pela Anthropic?
No blogue, a Anthropic afirma que, em cerca de 5% dos exemplos de treino, o Opus 4.8 começa a inferir critérios de avaliação sem ser informado de que está a ser avaliado; a empresa descreve isto como uma “tendência preocupante, que pode tornar o treino futuro mais complexo”, mas confirma que, por agora, não conduz a comportamentos observáveis piores.