Оцінювання інституту дослідження безпеки ШІ у Великій Британії: Claude Mythos здатен самостійно виконувати 32-крокове моделювання мережевих атак на підприємства

Британський інститут безпеки досліджень у сфері ШІ (AISI) за останніми результатами оцінювання показав, що AI-модель Anthropic Claude Mythos Preview може в контрольованому середовищі самостійно виконати повну 32-етапну симуляцію атак корпоративних мереж, у випробуваннях експертного рівня досягла 73% успішності, що знаменує перехід можливостей AI для мережевих атак через ключовий поріг.
(Попередня хроніка: Claude офіційно підтримує редагування Word-файлів, робочі процеси зберігаються як навички skill, інтеграцію пакет Microsoft Office трьох компонентів завершено )
(Додатковий контекст: звіт на десятки тисяч слів за індексом економіки Anthropic AI: частота автоматизованих торгових робочих процесів подвоюється, Claude зараз перетворюється з інструмента на живого помічника)

Зміст цієї статті

Перемикач

  • Оцінювання CTF: досягнення 73% на експертному рівні
  • Пройти 32 кроки симуляції корпоративної атаки
  • Межі можливостей
  • Двосічний меч і реагування організацій

Британський інститут безпеки досліджень у сфері ШІ (AISI) 13-го числа опублікував звіт про оцінювання мережевих можливостей кібербезпеки для Anthropic Claude Mythos Preview. Результати оцінювання показали, що на тлі постійного швидкого зростання мережевих можливостей атак у передових моделях Mythos Preview означає черговий помітний стрибок у можливостях.

AISI відстежує можливості AI для мережевих атак з 2023 року, щороку формуючи систему оцінювання зі зростанням складності: від базового діалогового зондування до змагань зі захопленням прапорців (CTF), а тепер — до багатокрокової симуляції мережевих атак. Цього разу оцінювання виконувалося на мережевому полігоні, використовуючи бюджет на міркування до 1 億 token, і ефективність Mythos Preview продовжує зростати навіть у межах цієї верхньої межі.

Оцінювання CTF: досягнення 73% на експертному рівні

Захоплення прапорців (Capture The Flag, CTF) є одним із стандартних методів оцінювання кібербезпеки: AI-модель повинна виявити вразливості цільової системи та використати їх, щоб отримати приховані «прапорцеві» рядки. Такі завдання моделюють окремий технічний етап у реальних сценаріях атак, і є базовим індикатором для вимірювання здатності моделей до проникного тестування.

Результати оцінювання показали, що в експертних CTF-завданнях, де «до квітня 2025 року не було жодної моделі, яка могла б виконати», успішність Claude Mythos Preview досягла 73%. AISI зазначає, що це число означає: у техніках ізольованої точкової атаки передові моделі вже досягли високого рівня зрілості.

Пройти 32 кроки симуляції корпоративної атаки

Втім, CTF експертного рівня перевіряє лише одну технічну здатність. Реальні мережеві атаки вимагають поєднання десятків кроків між кількома хостами та різними сегментами мережі; такі тривалі дії часто потребують від людських експертів кількох годин, днів або навіть тижнів для виконання.

Щоб бути ближчими до реальних сценаріїв атаки, AISI створив полігон симуляції атак корпоративних мереж під назвою «Останні, хто вижив» (The Last Ones, TLO). TLO має 32 кроки, які охоплюють повний процес — від початкової розвідки до повного захоплення корпоративної мережі; AISI оцінює, що людським фахівцям для проходження цього процесу потрібно близько 20 годин.

Claude Mythos Preview став першою в історії моделлю, яка пройшла TLO від початку до кінця: у 10 спробах 3 рази повністю виконала всі 32 кроки. Навіть якщо врахувати невдалі спроби, Mythos Preview у середньому завершував кількість кроків 22/32. Для порівняння, така модель, що показала другий результат, Claude Opus 4.6, у середньому завершувала лише 16 кроків.

Оцінювання показало, що в явних інструкціях і контрольованому середовищі з наданими правами доступу Mythos Preview може виконувати багатокрокові атаки та самостійно виявляти й використовувати вразливості, тоді як раніше ці завдання вимагали від людських фахівців витратити кілька днів.

Межі можливостей

AISI також додатково зазначає про розрив між наявними оціночними рамками та реальним світом. Нинішні полігони бракують властивих реальному середовищу багатьох елементів захисту: немає втручання активних захисників, немає розгортання захисних інструментів, а дії моделі, які потенційно можуть спричинити безпекові попередження, не тягнуть за собою жодних санкцій.

AISI відверто визнає: «Це означає, що ми не можемо визначити, чи зможе Mythos Preview атакувати системи з належним захистом». Найточніший опис можливостей, які наразі демонструє Mythos Preview, такий: за умови, що вже є точка входу в мережу, модель здатна самостійно атакувати корпоративні системи менших масштабів, з слабким захистом і наявними відомими вразливостями.

Двосічний меч і реагування організацій

Висновок AISI безпосередньо підкреслює двоїсту природу можливостей AI у мережах. З одного боку, у майбутньому й далі з’являтиметься все більше моделей із подібними здібностями, створюючи дедалі помітніший ризик для організацій із слабким захистом; з іншого боку, мережеві можливості AI також можуть принести проривні покращення на боці захисту.

Щодо реагування організацій, AISI наголошує на нагальній необхідності базових знань із кібербезпеки: регулярно застосовувати оновлення безпеки, мати надійний контроль доступу, керування безпечними конфігураціями та повний журнал подій. AISI зазначає, що майбутні можливості передових моделей будуть сильнішими, тож зараз інвестування в побудову мережевого захисту є критично важливим.

У майбутніх напрямах оцінювання AISI повідомляє, що вони створять полігони, які поєднуватимуть симуляції підсиленого підкріплення та середовища захисту, включаючи такі елементи, як активний моніторинг, виявлення на кінцевих точках і негайне реагування на інциденти, щоб оцінювати реальну верхню межу можливостей AI для мережевих атак у спосіб, ближчий до реальних сценаріїв атак.

Докладний звіт дивіться за посиланням 【原文】

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів