O Google DeepMind lançou o AI co-matematician, um assistente de pesquisa em matemática multiagente, alcançando 47,9% de acurácia no benchmark FrontierMath Tier 4, superando o recorde anterior do GPT-5.5 Pro de 39,6% em 9 de maio. O sistema resolveu 23 de 48 problemas, incluindo 3 que nenhum modelo anterior conseguiu resolver. Construído sobre o Gemini 3.1 Pro, a arquitetura usa um design hierárquico com um agente coordenador do projeto distribuindo tarefas para subagentes encarregados de recuperação de literatura, codificação e raciocínio, com vários agentes revisores validando as provas antes do envio.
A Epoch AI conduziu testes às cegas, impedindo que a equipe do DeepMind visse os problemas, com cada questão permitida para 48 horas de computação. Na aplicação no mundo real, o matemático Marc Lackenby usou o sistema para resolver uma conjectura em aberto do Kourovka Notebook, demonstrando seu valor prático de pesquisa. O sistema está atualmente disponível para um número limitado de matemáticos em testes beta.