Bộ trưởng Tài chính Mỹ và Chủ tịch Cục Dự trữ Liên bang đã khẩn cấp triệu tập các lãnh đạo cấp cao trên Phố Wall để cảnh báo về mô hình Mythos mới nhất của Anthropic. Giới chức đã xác định mô hình này là rủi ro mang tính hệ thống đối với hệ thống tài chính.
Theo tường thuật của 《Bloomberg》, Bộ trưởng Tài chính Mỹ Scott Bessent và Chủ tịch Cục Dự trữ Liên bang Jerome Powell đã khẩn cấp triệu tập các CEO ngân hàng lớn trên Phố Wall tại trụ sở Bộ Tài chính ở Washington vào tuần trước, để đưa ra cảnh báo về các rủi ro an ninh mạng mà mô hình AI mới nhất của công ty Anthropic, “Claude Mythos Preview”, có thể gây ra.
Các lãnh đạo ngân hàng tham dự cuộc họp gồm CEO của Citigroup, Jane Fraser; CEO của Morgan Stanley, Ted Pick; CEO của Bank of America, Brian Moynihan; CEO của Wells Fargo, Charlie Scharf; và CEO của Goldman Sachs, David Solomon; trong khi CEO của JPMorgan Jamie Dimon không thể tham dự. Các tổ chức nói trên đều được cơ quan quản lý xếp vào nhóm các tổ chức tài chính có tầm quan trọng mang tính hệ thống.
Cuộc họp lần này có sự tham dự trực tiếp của Bộ trưởng Tài chính và Chủ tịch Cục Dự trữ Liên bang, được giới trong ngành xem là một động thái bất thường. Trong quá khứ, sự can thiệp của chính phủ đối với rủi ro AI chủ yếu dừng ở các nhóm công tác cấp cơ quan; nay, nó được nâng cấp trực tiếp thành việc cảnh báo của những người đứng đầu cao nhất của cơ quan tài chính, cho thấy rõ rằng giới chức đã coi mối đe dọa an ninh mạng do AI là rủi ro mang tính hệ thống đối với sự ổn định của hệ thống tài chính.
Theo tài liệu kỹ thuật do Anthropic công bố cùng ngày, Mythos có khả năng nhận diện và khai thác lỗ hổng trên mọi hệ điều hành và trình duyệt web phổ biến. Ở giai đoạn thử nghiệm, mô hình tự tìm ra hàng nghìn lỗ hổng zero-day (zero-day vulnerabilities) chưa từng được biết đến trước đó, trong đó có một lỗ hổng tồn tại suốt 27 năm trong một hệ điều hành mã nguồn mở thiên về bảo mật là OpenBSD; ngoài ra, mô hình cũng phát hiện một lỗ hổng trong thư viện xử lý âm thanh/video FFmpeg mà ngay cả khi chạy bằng các công cụ kiểm thử tự động 5.000.000 lần quy trình cũng không thể phát hiện được.
Các nhà nghiên cứu của Anthropic nhấn mạnh rằng năng lực phát hiện lỗ hổng của Mythos bắt nguồn từ tiến bộ tổng thể của mô hình về viết mã, suy luận và tính tự chủ, chứ không phải kết quả của việc huấn luyện một cách cố ý.
Công ty trong tuyên bố nêu: “Khả năng giúp mô hình hiệu quả hơn trong việc vá lỗ hổng cũng khiến nó hiệu quả hơn trong việc khai thác lỗ hổng.” Nhận định này làm nổi bật tính hai mặt của Mythos: ranh giới giữa phòng thủ và tấn công gần như bị xóa nhòa trước các mô hình như vậy.
Do năng lực quá mạnh, Anthropic quyết định không công khai phát hành Mythos ra bên ngoài, mà áp dụng chiến lược hạn chế truy cập, chỉ mở cho các doanh nghiệp hợp tác nhất định sử dụng. Đồng thời, công ty cũng thông báo khởi động chương trình hợp tác an ninh mạng mang tính phòng thủ có tên “Project Glasswing” (Kế hoạch Cánh Kính), hợp tác với hơn 40 đối tác doanh nghiệp như AWS, Apple, Cisco, Google, JPMorgan, Microsoft, Nvidia,… Mục tiêu là chủ động tìm và vá lỗ hổng trong các phần mềm then chốt trước khi kẻ tấn công ra tay.
Nguồn ảnh: X/@AnthropicAI Anthropic đồng thời thông báo khởi động chương trình hợp tác an ninh mạng mang tính phòng thủ có tên “Project Glasswing” (Kế hoạch Cánh Kính)
Anthropic cho biết: “Vì năng lực của mô hình là rất mạnh, chúng tôi áp dụng thái độ thận trọng trong cách thức phát hành. Chúng tôi đang hợp tác với một nhóm nhỏ khách hàng truy cập sớm để thử nghiệm mô hình này và tin rằng đây là thế hệ đột phá nhất mà chúng tôi đã xây dựng cho đến nay.”
Công ty cũng tiết lộ rằng họ đã trình bày trước các quan chức chính phủ về các kịch bản ứng dụng tấn công và phòng thủ liên quan đến Mythos, đồng thời tiếp tục duy trì trao đổi với Cơ quan An ninh mạng và Cơ sở hạ tầng An ninh (CISA) của Mỹ và Trung tâm Đổi mới Tiêu chuẩn AI. Mối quan tâm trọng tâm của bên ngoài sau đó sẽ tập trung vào việc cơ quan quản lý sẽ xây dựng các tiêu chuẩn thẩm định phát hành cho các mô hình tương tự như thế nào, các tổ chức tài chính cần áp dụng những biện pháp phòng vệ cụ thể nào, và liệu sự phối hợp giữa các cơ quan quản lý quốc tế có theo kịp tốc độ tiến hóa của công nghệ hay không.
Nội dung bài viết này do nền tảng Agent mã hóa tổng hợp thông tin từ nhiều phía, được 《加密城市》 duyệt bản thảo và biên tập; hiện vẫn đang ở giai đoạn đào tạo, có thể tồn tại sai lệch logic hoặc sai sót về thông tin, nội dung chỉ mang tính tham khảo, vui lòng không xem đây là lời khuyên đầu tư.