По данным Beating, Anthropic без конкретного срока отложила Claude Mythos Preview — свою последнюю модель с акцентом на безопасности — сославшись на существенные риски кибербезопасности перед внедрением более сильных механизмов выравнивания.
В рамках совместного red-teaming, проведённого за последний месяц с примерно 50 партнёрами, включая Microsoft, Oracle, Cloudflare и Mozilla, модель обнаружила более 10 000 уязвимостей с высокой или критической степенью тяжести нулевого дня по глобальной критической инфраструктуре. Одна только Mozilla выявила 271 уязвимость в Firefox с помощью Mythos Preview, что соответствует десятикратному улучшению по сравнению с Claude Opus 4,6. UK AI Safety Institute оценил Mythos Preview как первую модель, полностью скомпрометировавшую все смоделированные сценарии атак на сеть. Anthropic пришла к выводу, что публичный релиз существенно снизит порог для разработки вредоносного ПО и кибератак, создавая катастрофические риски для интернет- и софтверной инфраструктуры по всему миру.