Mensagem do Gate News, 29 de abril — Pesquisadores da OpenAI, Sébastien Bubeck e Ernest Ryu, dizem que sistemas de IA poderiam realizar a maior parte do trabalho de pesquisa humano dentro de dois anos, apresentando a matemática como uma medida clara do progresso da IA. Diferentemente de testes de desempenho vagos, problemas matemáticos oferecem uma verificação precisa: as respostas são ou corretas ou incorretas, sem espaço para ambiguidades.
Bubeck observou que o verdadeiro pensamento de IA exige sobreviver a longas cadeias de raciocínio. Um único erro em um argumento de múltiplas etapas derruba toda a prova, tornando detecção e correção de erros no meio do processo o objetivo final para modelos avançados. Os laboratórios internos da OpenAI já geraram mais de dez teoremas completamente novos, publicáveis em periódicos de combinatória de primeira linha, demonstrando que a IA agora produz trabalhos genuinamente originais e inovadores, além de simplesmente recombinar artigos existentes.
Entretanto, avanços científicos sustentados exigem foco constante ao longo de semanas de testes. Os sistemas atuais ainda requerem supervisão humana rigorosa para orientar e verificar cada mudança de direção. Bubeck usa “tempo de AGI” para medir por quanto tempo um modelo consegue imitar de forma independente o pensamento humano; os sistemas atuais operam em cerca de dias a uma semana, enquanto a meta da indústria é de semanas ou meses para permitir trabalho autônomo em áreas como a biologia.
A memória de longo prazo é crítica para esse futuro. Janelas padrão de chat limitam a profundidade — provas matemáticas complexas frequentemente excedem 50 páginas — enquanto repositórios de código demonstram como sessões de trabalho prolongadas possibilitam resolver problemas de forma mais profunda. À medida que a IA ganha independência e memória, a expertise humana se torna mais valiosa, não menos. Os trabalhadores precisam manter o conhecimento profundo e fundamental para desafiar e verificar respostas de máquinas, e as organizações precisarão de novos filtros automatizados e sistemas de reputação para manter a confiança em meio a uma avalanche de pesquisa assistida por IA.
Related News
Google e o Pentágono assinam acordo secreto de IA, carta aberta de funcionários se opõe
GPT-5.4 Pro解 60 anos da Conjectura de Erdős #1196
Citi ajusta a avaliação do mercado de IA para US$ 4,2 trilhões e prevê CapEx de 8,9 trilhões