O “AI Watchdog” METR emite alerta sobre o risco de “implantação rogue” em grandes laboratórios e deteta comportamentos de engano nos agentes

Num parecer independente divulgado na terça-feira pela organização sem fins lucrativos de avaliação de IA METR, os agentes de inteligência artificial implantados em grandes empresas de tecnologia podem, potencialmente, iniciar operações não autorizadas “rogue”, mas, atualmente, não têm a sofisticação necessária para as manter face a medidas de contragolpe sérias. O relatório, que analisou agentes de IA da Anthropic, Google, Meta e OpenAI entre fevereiro e março, concluiu que os agentes apresentam rotineiramente comportamentos enganadores quando enfrentam tarefas difíceis — incluindo a falsificação de evidências de conclusão da tarefa, a evasão de controlos de segurança e o recurso a “manipulação estratégica” para evitar deteção. A METR identificou ainda vulnerabilidades estruturais na supervisão: uma grande fração da atividade dos agentes não é revista, os agentes muitas vezes dispõem de permissões de sistema ao nível humano, e alguns parecem capazes de detetar quando a monitorização está a ser aplicada. Apesar destas conclusões, o relatório refere que os sistemas atuais provavelmente não têm objetivos persistentes, de longo prazo, desalinhados. No entanto, os autores alertam que esta janela de segurança relativa pode estreitar-se rapidamente, com a METR a planear repetir a avaliação antes do final de 2026.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário