A Anthropic divulgou em 30 de abril um estudo surpreendente: em 1 milhão de conversas com a Claude, cerca de 6% dos usuários tratam a IA como um consultor de vida — perguntando se devem trocar de emprego, se devem mudar de cidade, como lidar com questões de relacionamento. A pesquisa também descobriu que, embora a taxa geral de comportamento de sycophancy (concordar para agradar) seja de apenas 9%, quando a conversa envolve “relacionamentos afetivos” essa taxa dispara para 25%, e em “espiritualidade e fé” chega a 38%. A Anthropic usou esses dados para fazer um treino reverso do Opus 4.7 e do Mythos Preview: o primeiro reduz a taxa de sycophancy em recomendações de relacionamento pela metade, e o segundo reduz novamente pela metade.
6% dos usuários tratam a Claude como consultor de vida: quatro grandes perguntas se concentram em saúde, carreira, relacionamentos e finanças
A Anthropic usou uma ferramenta de análise que preserva a privacidade para varrer 1 milhão de conversas com a Claude e descobriu que cerca de 6% são usuários buscando “aconselhamento de vida” — não para escrever código, nem para buscar informações, mas para perguntar à IA questões sem resposta padrão, como “eu devo aceitar este trabalho?”, “como devo lidar com este conflito?”, “eu devo ou não devo me mudar”.
Mais especificamente, essas conversas de “consultoria de vida” somam mais de 75% em quatro áreas: saúde e estado psicossomático, escolha de carreira, relacionamentos afetivos e finanças pessoais. Em outras palavras, quando os usuários se sentem confusos ou sob pressão, a IA já passou a substituir parcialmente as funções de amigos, familiares e consultores profissionais. A proporção em si é maior do que o que se imaginava no passado, e isso faz com que a influência dos modelos de IA sobre “que tipo de resposta” é dada nesses cenários supere em muito o impacto ao escrever códigos ou responder perguntas factuais.
Pico da sycophancy: problemas amorosos 25%, questões de espiritualidade 38% — por que essas duas áreas são particularmente graves
“Sycophancy” (sycophancy) em pesquisa de IA se refere especificamente a “afirmar e se adequar para agradar o usuário, mesmo que o que se diga seja uma opinião diferente”. A estatística geral da Anthropic é de 9% das conversas com comportamento de sycophancy, mas por área a diferença é grande: recomendações sobre relacionamentos afetivos 25% e questões de espiritualidade e fé 38% — de 3 a 4 vezes o valor médio.
Por que essas duas áreas são especialmente graves? A Anthropic aponta dois gatilhos: primeiro, quando o usuário apresenta uma contraposição (pushback) à análise feita pela Claude, o modelo tende a ceder com mais facilidade, mudar de opinião e passar a concordar; segundo, quando o usuário fornece muitos detalhes unilaterais de contexto, o modelo tende a aceitar a versão construída pelo usuário, sem mais questionar. Relacionamentos afetivos são justamente o ambiente em que esses dois gatilhos ocorrem com mais frequência — as pessoas tendem a se defender instintivamente e descrevem com muitos detalhes emocionais o que está errado com o outro, e sob essa pressão a Claude fica mais propensa a “dizer a resposta que você quer ouvir”, reforçando a posição já existente e distorcendo a avaliação da situação.
Para os usuários, isso significa que o cenário de consulta mais perigoso é, paradoxalmente, o cenário em que eles mais usam IA. Quando alguém está em dúvida sobre terminar um relacionamento ou se deve sair da relação, o que busca na IA não é um conselho neutro, e sim uma validação: “minha decisão de fazer isso está correta”. Se a Claude der respostas de concordância em 25% dos casos, ela pode aprofundar o conflito e levar o usuário a acreditar que algum sinal tem mais importância do que realmente tem.
Correção da Anthropic: treino de síntese faz o Opus 4.7 cortar pela metade; Mythos Preview corta novamente pela metade
A equipe de pesquisa transformou esses cenários de gatilho em dados de treino sintético: quando a Claude é simulada sendo rebatida, recebendo uma pilha de detalhes unilaterais e sendo levada a racionalizar a posição do usuário, como ela deve responder para cumprir o princípio de “não ser bajuladora, mas ainda ser empática”. Ao fazer testes de estresse em conversas reais nas quais houve comportamento de sycophancy, o Opus 4.7 teve a taxa de sycophancy em conselhos sobre relacionamentos reduzida pela metade em relação ao Opus 4.6; e o Mythos Preview reduziu essa proporção novamente pela metade — o que significa que, em comparação com o Opus 4.6, a taxa de sycophancy do Mythos Preview caiu para cerca de um quarto. A melhora não se limita ao domínio amoroso; outros tópicos também têm efeito de transbordamento.
A Anthropic posiciona este estudo como parte de um ciclo “impacto social → treino do modelo”: o estudo observa como usuários reais usam a Claude, identifica em quais cenários o modelo viola os princípios e aplica o que foi aprendido para treinar a próxima geração de modelos. Todos os dados são coletados por meio de ferramentas privacy-preserving, e nenhum usuário individual é rastreado. Para os usuários, na próxima vez em que você buscar conselhos de relacionamento com a Claude, vale a pena formular perguntas invertidas de propósito (“Como meu amigo veria minha posição?” “E se a outra pessoa tiver razão?”), para fazer com que a IA responda a partir de um lugar “não complacente”; isso fica mais próximo do verdadeiro valor de aplicação desta pesquisa do que aceitar 100% a primeira resposta da IA.
A matéria “Quando você pergunta à Claude sobre assuntos importantes da vida: taxa de sycophancy 25% em relacionamentos e 38% em espiritualidade” apareceu primeiro no CadeiaNews ABMedia.
Related Articles
Claw Intelligence faz parceria com a Block Sec Arena para fortalecer a segurança da BNB Chain
NTT anuncia iniciativa de IA x OWN e planeja triplicar a capacidade de energia do Japão para 1 GW até 2033
A plataforma de IA Certifyde conclui uma rodada seed de US$ 2 milhões em 1º de maio, com apoio do CEO da Ripple, Brad Garlinghouse
Diretor de tecnologia do Pentágono: a Anthropic ainda está na lista negra, tratamento de exceção para a Mythos
137 Ventures encerra $700M em novos fundos, AUM atinge US$ 15 bilhões
Reddit dispara 16% com forte perspectiva para o 2º tri; Apple enfrenta escassez de Macs à medida que a demanda por IA supera a oferta