オックスフォード大学でのジャック・クラークの講演によれば、Anthropicの共同創業者は、人工知能が再帰的な自己改善、つまり自律的に自分をアップグレードし、より高度なバージョンを作り出す能力を実現しうると警告した。これは2028年、あるいはそれ以前にまで到達する可能性がある。クラークは、Anthropic自身がAIの進展スピードを大幅に見誤っており、最先端のモデルによってもたらされるリスクに対して準備が不十分だと認めた。
クラークは、2026年4月に完成した社内モデル「Mythos」を、こうしたリスクの証拠として挙げた。このモデルは、国家レベルのサイバー攻撃兵器に匹敵する能力を備えている。その破壊的な可能性ゆえに、AnthropicはMythosの一般公開を無期限で禁止し、ソフトウェア脆弱性の研究目的に限って、少数の機関にのみアクセスを認めている。