O co-matemático de IA da Google DeepMind atinge 47,9% no FrontierMath da Categoria 4, supera o GPT-5,5 Pro e resolve 3 problemas previamente insolúveis

O Google DeepMind lançou o AI co-matematician, um assistente de pesquisa em matemática multiagente, alcançando 47,9% de acurácia no benchmark FrontierMath Tier 4, superando o recorde anterior do GPT-5.5 Pro de 39,6% em 9 de maio. O sistema resolveu 23 de 48 problemas, incluindo 3 que nenhum modelo anterior conseguiu resolver. Construído sobre o Gemini 3.1 Pro, a arquitetura usa um design hierárquico com um agente coordenador do projeto distribuindo tarefas para subagentes encarregados de recuperação de literatura, codificação e raciocínio, com vários agentes revisores validando as provas antes do envio.

A Epoch AI conduziu testes às cegas, impedindo que a equipe do DeepMind visse os problemas, com cada questão permitida para 48 horas de computação. Na aplicação no mundo real, o matemático Marc Lackenby usou o sistema para resolver uma conjectura em aberto do Kourovka Notebook, demonstrando seu valor prático de pesquisa. O sistema está atualmente disponível para um número limitado de matemáticos em testes beta.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários