Mensagem do Gate News, 29 de abril — Pesquisadores da OpenAI, Sébastien Bubeck e Ernest Ryu, dizem que sistemas de IA poderiam realizar a maior parte do trabalho de pesquisa humano dentro de dois anos, apresentando a matemática como uma medida clara do progresso da IA. Diferentemente de testes de desempenho vagos, problemas matemáticos oferecem uma verificação precisa: as respostas são ou corretas ou incorretas, sem espaço para ambiguidades.

Bubeck observou que o verdadeiro pensamento de IA exige sobreviver a longas cadeias de raciocínio. Um único erro em um argumento de múltiplas etapas derruba toda a prova, tornando detecção e correção de erros no meio do processo o objetivo final para modelos avançados. Os laboratórios internos da OpenAI já geraram mais de dez teoremas completamente novos, publicáveis em periódicos de combinatória de primeira linha, demonstrando que a IA agora produz trabalhos genuinamente originais e inovadores, além de simplesmente recombinar artigos existentes.

Entretanto, avanços científicos sustentados exigem foco constante ao longo de semanas de testes. Os sistemas atuais ainda requerem supervisão humana rigorosa para orientar e verificar cada mudança de direção. Bubeck usa "tempo de AGI" para medir por quanto tempo um modelo consegue imitar de forma independente o pensamento humano; os sistemas atuais operam em cerca de dias a uma semana, enquanto a meta da indústria é de semanas ou meses para permitir trabalho autônomo em áreas como a biologia.

A memória de longo prazo é crítica para esse futuro. Janelas padrão de chat limitam a profundidade — provas matemáticas complexas frequentemente excedem 50 páginas — enquanto repositórios de código demonstram como sessões de trabalho prolongadas possibilitam resolver problemas de forma mais profunda. À medida que a IA ganha independência e memória, a expertise humana se torna mais valiosa, não menos. Os trabalhadores precisam manter o conhecimento profundo e fundamental para desafiar e verificar respostas de máquinas, e as organizações precisarão de novos filtros automatizados e sistemas de reputação para manter a confiança em meio a uma avalanche de pesquisa assistida por IA.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

04-29 03:35

Relatório da a16z Crypto: Agentes de IA Alcançam Até 70% de Taxa de Sucesso ao Explorar Vulnerabilidades de Manipulação de Preços em DeFi Com Conhecimento Estruturado

04-28 18:52

Anthropic atinge avaliação de $1 trilhões, ultrapassando a OpenAI em mercados secundários

04-28 08:31

Adobe Lança Firefly AI Assistant com Fluxos de Trabalho entre Múltiplos Apps, Integra Claude

04-27 09:11

Greg Brockman da OpenAI: IA mudando de conversa para execução autônoma de tarefas

04-27 05:17

GPT-5.5 Volta ao Topo em Codificação, mas a OpenAI Troca os Benchmarks Depois de Perder para o Opus 4.7

Análise aprofundada