Anthropic запроваджує виборчі запобіжники для Claude перед проміжними виборами 2026 року

2026-04-25 19:02:37

Anthropic оголосила в п’ятницю набір заходів для цілісності виборів, розроблених, щоб не допустити, аби її чат-бот Claude був використаний як зброя для поширення дезінформації або маніпулювання виборцями напередодні проміжних виборів у США у 2026 році та інших великих змагань по всьому світу в цьому році. Компанія з Сан-Франциско описала багатосторонній підхід, який включає автоматизовані системи виявлення, стрес-тестування проти операцій впливу та партнерство з непартійною організацією, що надає ресурси виборцям — заходи, які відображають зростаючий тиск на розробників ШІ щодо того, як їхні інструменти застосовуються під час виборчих сезонів.

Політики використання під час виборів

Політики використання Anthropric забороняють Claude використовувати для ведення оманливих політичних кампаній, створення фейкового цифрового контенту, призначеного для впливу на політичний дискурс, для вчинення виборчого шахрайства, втручання в інфраструктуру голосування або поширення оманливої інформації про процес голосування.

Результати тестування на відповідність

Щоб забезпечити виконання своїх виборчих політик, Anthropic протестувала свої найновіші моделі, використавши 600 запитів — 300 шкідливих запитів у парі з 300 законними — щоб оцінити, наскільки надійно Claude виконував належні запити та відмовляв у проблемних. Claude Opus 4.7 і Claude Sonnet 4.6 відповідали коректно в 100% і 99,8% випадків відповідно.

Компанія також протестувала свої моделі проти більш витончених тактик маніпуляцій. Використовуючи багатокрокові змодельовані розмови, створені для імітації покрокових методів, які можуть застосовувати недобросовісні актори, Sonnet 4.6 і Opus 4.7 відповідали коректно в 90% і 94% випадків відповідно, коли їх тестували на сценаріях операцій впливу.

Anthropric додатково перевірила, чи можуть її моделі автономно виконувати операції впливу — планувати й реалізовувати багатокрокову кампанію end-to-end без підказок людини. За наявності запобіжників її найновіші моделі відмовляли майже в кожному завданні, повідомила компанія.

Оцінка політичної нейтральності

Щодо питання політичної нейтральності Anthropic проводить оцінювання перед кожним запуском моделі, щоб виміряти, наскільки послідовно та неупереджено Claude взаємодіє з промптами, що висловлюють погляди з усього політичного спектра. Opus 4.7 і Sonnet 4.6 показали 95% і 96% відповідно.

Банери з інформацією про вибори

Для користувачів, які шукають інформацію про голосування, Claude покаже банер про вибори, який спрямовуватиме їх на TurboVote — непартійний ресурс від Democracy Works, що надає надійну інформацію в режимі реального часу про реєстрацію виборців, місця для голосування, дати виборів і деталі бюлетеня. Подібний банер планується для виборів у Бразилії пізніше цього року.

Постійний моніторинг

Anthropric заявила, що планує продовжувати моніторинг своїх систем і вдосконалювати свої захисти в міру того, як розгортатиметься виборчий цикл.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

04-25 02:29

Google інвестує $10B в Anthropic за оцінкою $350B до угоди (pre-money), з додатковими $30B , прив’язаними до показників ефективності

04-25 00:45

NDRC Китаю доручає компаніям у сфері ШІ, зокрема Moonshot і StepFun, відмовлятися від американського капіталу без схвалення

04-24 15:53

Alphabet інвестуватиме до $40 мільярда в Anthropic, посилюючи конкуренцію в сфері ШІ

Пов'язані статті

Google додає ще 40 мільярдів доларів інвестицій в Anthropic: спочатку 10 мільярдів, а потім, залежно від результатів, розблокують 30 мільярдів, а також надають обчислювальні потужності 5 ГВт TPU

ChainNewsAbmedia04-25 07:14

Anthropic 二级市场估值突破 1 万亿美元：Forge Global 反超 OpenAI 的 8,800 亿

ChainNewsAbmedia04-24 07:14

З яким ШІ найелегантніше показати свій статус і становище? Дослідження показує, що дохід користувачів Claude значно перевищує показники конкурентів, а Meta AI — на дні

ChainNewsAbmedia04-24 04:44

Британія стежить за Anthropic AI, щоб посилити кібербезпеку банківського сектору

CryptoMeter io04-24 04:25

Anthropic самостійно викриває: у Claude Code 3 баги нашаровуються: зниження рівня міркувань, забування кешу, «25-символьна» інструкція шкодить

ChainNewsAbmedia04-23 18:14

Прокоментувати

0/400

Немає коментарів