Depois que a IA se tornou uma ferramenta padrão nas empresas, um fenômeno que antes era visto como “um problema de percepção corporal” está rapidamente vindo à tona: os LLMs (modelos de linguagem de grande porte) estão ficando “mais burros”. O internauta Wisely Chen apontou que, o que se chama de “LLM perdendo a inteligência” não é apenas uma lenda urbana; já é algo que pode ser acompanhado continuamente por meio de dados e que está causando impactos reais nos fluxos de trabalho corporativos.
Ele usou sua própria experiência como exemplo: em 15 de abril, o serviço da linha Claude, da Anthropic, passou por um rebaixamento geral, incluindo claude.ai, API e Claude Code, que exibiram “Degraded Performance”. Isso não é apenas uma simples lentidão ou um erro ocasional; a qualidade das respostas desabou de forma evidente, chegando a haver situações em que não era possível usar corretamente, o que fez com que seus três projetos de desenvolvimento do dia inteiro fossem adiados.
Esse tipo de cenário talvez seja apenas uma queda de eficiência para desenvolvedores individuais, mas para equipes de TI de empresas o impacto é multiplicado. Quando uma equipe tem vários engenheiros dependendo ao mesmo tempo de ferramentas de IA para coding, escrita de documentos e automação de processos, uma queda do modelo em um único momento significa que a produtividade geral despenca coletivamente no mesmo período, o que então se converte em perdas consideráveis de tempo e custos.
A IA parece ter ficado mais burra? Dados confirmam que “já houve rebaixamento”
Wisely Chen apontou que “o GPT ficou mais burro”, “o Claude não é mais como antes” e outras afirmações que circulam na comunidade existem há muito tempo, mas por muito tempo faltou apoio de dados objetivos. Só até recentemente, com o surgimento de plataformas de monitoramento contínuo da qualidade do modelo, é que esse fenômeno passou a ser quantificado pela primeira vez.
Nesse contexto, o StupidMeter realiza testes automatizados de 24 horas em modelos populares, incluindo OpenAI, Anthropic, Google e outros, acompanhando indicadores como exatidão, capacidade de raciocínio e estabilidade. Diferentemente de um benchmark tradicional feito uma única vez, esse tipo de sistema se aproxima mais da forma como empresas monitoram APIs ou a disponibilidade de serviços, observando as variações de desempenho do modelo em ambientes reais de uso.
Os resultados dos dados são bastante intuitivos: atualmente, a maioria dos modelos populares está em estado de alerta ou rebaixamento, e apenas alguns modelos mantêm o funcionamento normal. Isso significa que a qualidade do modelo é instável; não se trata de um problema de um único produto, mas de um fenômeno comum na indústria como um todo.
LLM faz downgrade de inteligência “por baixo do radar”, afetando a estabilidade das empresas nos fluxos de trabalho de IA
Para as empresas, essa mudança representa que a IA deixou de ser “uma ferramenta para aumentar a eficiência” e passou a ser “um fator que afeta a estabilidade”. Se o fluxo de trabalho diário de uma empresa — da programação ao code review, até a produção de documentos e relatórios de análise — já depende altamente de LLMs, então, quando o modelo apresentar queda de capacidade de raciocínio ou piora na qualidade das respostas em um dia, esses problemas não ocorrerão apenas localmente como um bug de software tradicional; eles vão se infiltrar ao mesmo tempo em todas as etapas em que se usa IA.
O mais importante é que essas oscilações muitas vezes são difíceis de prever e difíceis de perceber em tempo real. A maioria das empresas não possui mecanismos para monitorar continuamente a qualidade dos modelos; normalmente, só percebe-se o problema depois que os resultados ficam anormais ou depois que a eficiência da equipe cai, identificando então que a origem está no próprio modelo. Nesse cenário, “perder a inteligência” deixa de ser apenas uma percepção subjetiva dos usuários e passa a ser um risco sistêmico que afeta diretamente o ritmo da operação da empresa.
Quando a IA vira água e luz, a estabilidade se torna o novo indicador-chave
Wisely Chen compara o papel dos LLMs a “água e luz da empresa moderna”. Quando a IA já está profundamente integrada à operação diária, se tornando uma capacidade básica indispensável, a importância de sua estabilidade também aumenta.
No passado, ao avaliar ferramentas de IA, as empresas se concentravam principalmente na capacidade do modelo, no preço e nas funcionalidades; mas, com o surgimento do fenômeno de “perda de inteligência”, outro indicador ainda mais crucial passou a emergir: a estabilidade. Quando a qualidade do modelo pode variar sem aviso, as empresas deixam de apenas “usar IA” e precisam começar a assumir um tipo novo de risco de infraestrutura. E o mais desesperador é que, se você olhar apenas para os grandes modelos de linguagem mais avançados, basicamente, enquanto o problema de capacidade de computação não for resolvido, isso provavelmente continuará acontecendo.
Este artigo “Dados revelam que o ‘Claude’ perdeu inteligência e não é lenda urbana; modelos de IA instáveis viram risco para empresas” foi publicado pela primeira vez em 鏈新聞 ABMedia.
Related Articles
A ação da Meta sobe 1,73% enquanto a empresa planeja demitir 8.000 funcionários a partir de 20 de maio
O relatório anual do Google afirma que o Gemini realiza detecção em milissegundos, bloqueando 99% dos anúncios de golpes
Cofundador da Ethereum Lubin: a IA será um ponto de virada crítico para o cripto, mas o monopólio de gigantes de tecnologia traz risco sistêmico
Elon Musk Defende Cheques de “Renda Universal Alta” como Solução Definitiva para o Desemprego na IA
DeepSeek Supostamente Lança Primeira Rodada de Captação Externa, Mirando Avaliação de US$ 10B+ e US$ 300M+
Publicidade do ChatGPT avança para Austrália e Nova Zelândia: Free e usuários do Go primeiro, planos pagos mantêm sem anúncios