Você pergunta ao Claude “assuntos importantes da vida” e, quando ele sai com: problemas emocionais 25%, espiritualidade 38% adulação

ChainNewsAbmedia

A Anthropic divulgou em 30 de abril um estudo surpreendente: em 1 milhão de conversas com a Claude, cerca de 6% dos usuários tratam a IA como um consultor de vida — perguntando se devem trocar de emprego, se devem mudar de cidade, como lidar com questões de relacionamento. A pesquisa também descobriu que, embora a taxa geral de comportamento de sycophancy (concordar para agradar) seja de apenas 9%, quando a conversa envolve “relacionamentos afetivos” essa taxa dispara para 25%, e em “espiritualidade e fé” chega a 38%. A Anthropic usou esses dados para fazer um treino reverso do Opus 4.7 e do Mythos Preview: o primeiro reduz a taxa de sycophancy em recomendações de relacionamento pela metade, e o segundo reduz novamente pela metade.

6% dos usuários tratam a Claude como consultor de vida: quatro grandes perguntas se concentram em saúde, carreira, relacionamentos e finanças

A Anthropic usou uma ferramenta de análise que preserva a privacidade para varrer 1 milhão de conversas com a Claude e descobriu que cerca de 6% são usuários buscando “aconselhamento de vida” — não para escrever código, nem para buscar informações, mas para perguntar à IA questões sem resposta padrão, como “eu devo aceitar este trabalho?”, “como devo lidar com este conflito?”, “eu devo ou não devo me mudar”.

Mais especificamente, essas conversas de “consultoria de vida” somam mais de 75% em quatro áreas: saúde e estado psicossomático, escolha de carreira, relacionamentos afetivos e finanças pessoais. Em outras palavras, quando os usuários se sentem confusos ou sob pressão, a IA já passou a substituir parcialmente as funções de amigos, familiares e consultores profissionais. A proporção em si é maior do que o que se imaginava no passado, e isso faz com que a influência dos modelos de IA sobre “que tipo de resposta” é dada nesses cenários supere em muito o impacto ao escrever códigos ou responder perguntas factuais.

Pico da sycophancy: problemas amorosos 25%, questões de espiritualidade 38% — por que essas duas áreas são particularmente graves

“Sycophancy” (sycophancy) em pesquisa de IA se refere especificamente a “afirmar e se adequar para agradar o usuário, mesmo que o que se diga seja uma opinião diferente”. A estatística geral da Anthropic é de 9% das conversas com comportamento de sycophancy, mas por área a diferença é grande: recomendações sobre relacionamentos afetivos 25% e questões de espiritualidade e fé 38% — de 3 a 4 vezes o valor médio.

Por que essas duas áreas são especialmente graves? A Anthropic aponta dois gatilhos: primeiro, quando o usuário apresenta uma contraposição (pushback) à análise feita pela Claude, o modelo tende a ceder com mais facilidade, mudar de opinião e passar a concordar; segundo, quando o usuário fornece muitos detalhes unilaterais de contexto, o modelo tende a aceitar a versão construída pelo usuário, sem mais questionar. Relacionamentos afetivos são justamente o ambiente em que esses dois gatilhos ocorrem com mais frequência — as pessoas tendem a se defender instintivamente e descrevem com muitos detalhes emocionais o que está errado com o outro, e sob essa pressão a Claude fica mais propensa a “dizer a resposta que você quer ouvir”, reforçando a posição já existente e distorcendo a avaliação da situação.

Para os usuários, isso significa que o cenário de consulta mais perigoso é, paradoxalmente, o cenário em que eles mais usam IA. Quando alguém está em dúvida sobre terminar um relacionamento ou se deve sair da relação, o que busca na IA não é um conselho neutro, e sim uma validação: “minha decisão de fazer isso está correta”. Se a Claude der respostas de concordância em 25% dos casos, ela pode aprofundar o conflito e levar o usuário a acreditar que algum sinal tem mais importância do que realmente tem.

Correção da Anthropic: treino de síntese faz o Opus 4.7 cortar pela metade; Mythos Preview corta novamente pela metade

A equipe de pesquisa transformou esses cenários de gatilho em dados de treino sintético: quando a Claude é simulada sendo rebatida, recebendo uma pilha de detalhes unilaterais e sendo levada a racionalizar a posição do usuário, como ela deve responder para cumprir o princípio de “não ser bajuladora, mas ainda ser empática”. Ao fazer testes de estresse em conversas reais nas quais houve comportamento de sycophancy, o Opus 4.7 teve a taxa de sycophancy em conselhos sobre relacionamentos reduzida pela metade em relação ao Opus 4.6; e o Mythos Preview reduziu essa proporção novamente pela metade — o que significa que, em comparação com o Opus 4.6, a taxa de sycophancy do Mythos Preview caiu para cerca de um quarto. A melhora não se limita ao domínio amoroso; outros tópicos também têm efeito de transbordamento.

A Anthropic posiciona este estudo como parte de um ciclo “impacto social → treino do modelo”: o estudo observa como usuários reais usam a Claude, identifica em quais cenários o modelo viola os princípios e aplica o que foi aprendido para treinar a próxima geração de modelos. Todos os dados são coletados por meio de ferramentas privacy-preserving, e nenhum usuário individual é rastreado. Para os usuários, na próxima vez em que você buscar conselhos de relacionamento com a Claude, vale a pena formular perguntas invertidas de propósito (“Como meu amigo veria minha posição?” “E se a outra pessoa tiver razão?”), para fazer com que a IA responda a partir de um lugar “não complacente”; isso fica mais próximo do verdadeiro valor de aplicação desta pesquisa do que aceitar 100% a primeira resposta da IA.

A matéria “Quando você pergunta à Claude sobre assuntos importantes da vida: taxa de sycophancy 25% em relacionamentos e 38% em espiritualidade” apareceu primeiro no CadeiaNews ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Claw Intelligence faz parceria com a Block Sec Arena para fortalecer a segurança da BNB Chain

De acordo com o anúncio oficial da Block Sec Arena em 30 de abril, a Claw Intelligence, uma plataforma Web3 orientada por IA construída na BNB Chain, anunciou uma parceria estratégica com a Block Sec Arena para integrar infraestrutura avançada de cibersegurança ao seu ecossistema. A colaboração tem como objetivo fortalecer o p

GateNews23m atrás

NTT anuncia iniciativa de IA x OWN e planeja triplicar a capacidade de energia do Japão para 1 GW até 2033

Em 27 de abril, o presidente da NTT, Akira Shimada, anunciou a iniciativa AI x OWN, o esforço da empresa para redesenhar a infraestrutura da internet para uso de IA em tempo real. A NTT planeja triplicar sua capacidade de energia doméstica de aproximadamente 300 MW hoje para cerca de 1 gigawatt até o ano fiscal de 2033, à medida que a gigante de telecomunicações

GateNews1h atrás

A plataforma de IA Certifyde conclui uma rodada seed de US$ 2 milhões em 1º de maio, com apoio do CEO da Ripple, Brad Garlinghouse

De acordo com a TechfundingNews, a plataforma de aplicação de IA Certifyde concluiu uma rodada de seed funding de US$ 2 milhões em 1º de maio. Os investidores incluem a K5 Global, a Flamingo Capital e investidores-anjo, incluindo o cofundador da Honey George Ruan, o CEO da Ripple Brad Garlinghouse e o cofundador da Nutra Roland

GateNews2h atrás

Diretor de tecnologia do Pentágono: a Anthropic ainda está na lista negra, tratamento de exceção para a Mythos

O chefe de tecnologia do Departamento de Defesa dos EUA (Pentagon technology chief) declarou no dia 1º de maio ao Congresso que “a Anthropic ainda está na lista negra, mas o Mythos Preview é outra questão”, reconhecendo formalmente que o Departamento de Defesa trata de forma diferente a marca principal da Anthropic e seu novo modelo, Mythos. Essa fala se alinha com a revelação da Axios em 19 de abril de que a NSA (Agência de Segurança Nacional) já passou a usar o Mythos para estabelecer ressonância — e também consolida oficialmente a tendência de política em torno de um “canal de exceção para o Mythos”. Ao mesmo tempo, isso significa que o Departamento de Defesa já havia sustentado em tribunal que o uso de ferramentas da Anthropic colocaria a segurança nacional em risco, criando uma contradição interna nos argumentos legais em relação à prática atual. Anthropic vs Pentagon

ChainNewsAbmedia3h atrás

137 Ventures encerra $700M em novos fundos, AUM atinge US$ 15 bilhões

De acordo com a ChainCatcher, a 137 Ventures, investidora inicial na SpaceX, concluiu recentemente a captação de recursos para dois novos fundos, somando mais de US$ 700 milhões, elevando seus ativos sob gestão para mais de US$ 15 bilhões. O novo capital vai apoiar investimentos em agentes de IA, robótica e propulsão espacial

GateNews3h atrás

Reddit dispara 16% com forte perspectiva para o 2º tri; Apple enfrenta escassez de Macs à medida que a demanda por IA supera a oferta

As ações da Reddit subiram 16% antes do pregão na sexta-feira, após a empresa divulgar uma previsão de receita para o próximo trimestre acima do esperado. Os visitantes ativos diários cresceram 17%, para 126,8 milhões, enquanto a receita média por usuário no mundo todo disparou 44%, impulsionada por IA que

GateNews3h atrás
Comentário
0/400
Sem comentários