Cinco modelos de IA de fronteira discordam em 67% das alegações de checagem de fatos, aponta estudo
Um estudo publicado neste mês pelo pesquisador Kosta Jordanov, da Lenz Research, descobriu que cinco modelos avançados de IA discordaram em 67% de 1.000 alegações reais de checagem de fatos, com concordância unânime ocorrendo apenas em 328 alegações. A pesquisa testou GPT-5.4, Claude Opus 4.7, Gemini 3 Pro, Gemini 3 Pro com Search e Sonar Pro em alegações enviadas por usuários reais a uma plataforma de checagem de fatos. Os modelos alcançaram uma pontuação de Krippendorff's alpha de 0,639, fican
OliverGrant·12h atrás

