De acordo com o UK’s Artificial Intelligence Safety Institute (AISI), as capacidades autónomas de cibersegurança dos modelos de IA estão a registar um crescimento sem precedentes. Desde finais de 2024, a IA tem estado a duplicar a sua capacidade de concluir tarefas complexas de forma independente a cada 4,7 meses, com o Claude Mythos Preview e o GPT-5.5 a quebrarem recentemente esta curva de crescimento. Apesar de limitar tarefas individuais a 2,5 milhões de tokens, ambos os modelos atingiram taxas de sucesso próximas de 100% em tarefas de 12 horas, de maior dificuldade. O Claude Mythos Preview tornou-se o primeiro modelo a penetrar totalmente em ambos os cenários de cibersegurança de nível empresarial, incluindo o cenário Cooling Tower de alta dificuldade (3 sucessos em 10 tentativas), enquanto o GPT-5.5 obteve 3 sucessos em 10 tentativas na gama The Last Ones.