Theo Financial Times đưa tin hôm thứ Năm, Anthropic đã cài khoảng 6 kỹ sư tại Cơ quan An ninh Quốc gia (NSA) để triển khai mô hình AI Mythos của mình cho các hoạt động tấn công mạng. Các kỹ sư đang tùy biến mô hình cho các ứng dụng cụ thể, có thể bao gồm xâm nhập các mạng lưới ở Trung Quốc và Iran, theo một nguồn được FT trích dẫn. Việc triển khai diễn ra trong lúc Anthropic đồng thời công bố nghiên cứu kêu gọi một cơ chế tạm dừng toàn cầu có phối hợp trong phát triển AI và nộp hồ sơ IPO có thể định giá công ty ở mức hơn 1 nghìn tỷ USD.
Anthropic đã bố trí khoảng 6 kỹ sư vào bên trong Cơ quan An ninh Quốc gia để hỗ trợ triển khai Mythos—mô hình AI có năng lực cao nhất của họ—cho các hoạt động tấn công mạng, theo báo cáo của Financial Times. Các kỹ sư được điều động sẵn, tùy biến mô hình cho các ứng dụng cụ thể. Một nguồn nói với FT rằng mô hình này có thể hữu ích cho việc xâm nhập các mạng lưới tại các quốc gia như Trung Quốc và Iran.
Mythos là cùng một mô hình mà Anthropic đã từ chối công bố công khai, với lý do rủi ro bị lạm dụng. Công ty giới hạn mô hình cho các đối tác đã được thẩm định thông qua Project Glasswing—một liên minh bị hạn chế gồm Microsoft, Apple và Amazon. Chưa xác nhận liệu các kỹ sư có tham gia vào các hoạt động đang diễn ra hay không.
Anthropic đang khởi kiện Lầu Năm Góc sau khi Bộ trưởng Quốc phòng Pete Hegseth gắn nhãn công ty là rủi ro chuỗi cung ứng vào cuối tháng 2—một nhãn trước đây thường dành cho các đối thủ nước ngoài như Huawei. Việc gắn nhãn này diễn ra sau sự sụp đổ của một hợp đồng trị giá 200 triệu USD. Điểm vướng mắc: Anthropic từ chối cho phép Bộ Quốc phòng sử dụng Claude cho vũ khí hoàn toàn tự động hoặc giám sát hàng loạt trong nước. Hợp đồng với NSA được miễn trừ khỏi lệnh cấm đó.
Một thẩm phán ở California đã chặn việc đưa vào danh sách đen như một hành vi trả đũa theo Tu chính án thứ Nhất. Tòa phúc thẩm D.C. đã từ chối nỗ lực của Anthropic nhằm tạm dừng việc gắn nhãn trong lúc vụ kiện đang diễn ra. Theo báo cáo của FT, NSA vẫn tiếp tục sử dụng Mythos trong giai đoạn này. Hạn chót của Lầu Năm Góc để loại Claude khỏi các hệ thống của họ rơi vào tháng 8.
Ngay trong ngày câu chuyện về NSA được công bố, viện nghiên cứu nội bộ của Anthropic đã đăng “When AI Builds Itself,” phân tích mức độ Claude đã tiến xa trong việc tự động hóa quá trình phát triển của chính mình. Hiện Claude viết hơn 80% mã được hợp nhất vào cơ sở mã sản xuất của Anthropic—tăng từ mức chỉ ở dưới vài chữ số đơn lẻ trước khi Claude Code ra mắt vào đầu năm 2025. Theo báo cáo của Anthropic, các kỹ sư phát hành khoảng gấp 8 lần lượng mã mỗi ngày so với năm 2024.
Vào tháng 4, các tác nhân Claude được giao một bài toán về an toàn AI do chính Open AI đưa ra—liệu một mô hình yếu hơn có thể giám sát một mô hình mạnh hơn một cách đáng tin cậy hay không—và được để chạy. Hai nhà nghiên cứu con người trong khoảng một tuần đã thu hẹp 23% khoảng cách hiệu năng giữa các mô hình. Các tác nhân khôi phục 97% sau 800 giờ tính toán tích lũy. Con người đặt câu hỏi trong khi các tác nhân thiết kế mọi thí nghiệm. Các tác giả của báo cáo—Marina Favaro, trưởng viện Anthropic Institute, và đồng sáng lập Jack Clark—mô tả đây là trường hợp công bố đầu tiên về việc Claude đưa ra phán đoán trong nghiên cứu thay vì chỉ thực thi những nhiệm vụ được ai đó chỉ định.
Báo cáo lập luận ủng hộ một cơ chế tạm dừng toàn cầu có thể kiểm chứng—nhiều phòng thí nghiệm tuyến đầu dừng đồng thời với việc xác minh độc lập rằng tất cả mọi người thực sự đã dừng. Anthropic cho biết họ sẽ tham gia một cơ chế tạm dừng như vậy. Các tác giả so sánh cơ chế đề xuất với các hiệp ước hạt nhân thời Chiến tranh Lạnh được ký giữa Hoa Kỳ và Nga.
Anthropic cảnh báo quỹ đạo đang tiến tới việc tự cải thiện đệ quy: các hệ thống AI tự thiết kế, xây dựng và huấn luyện “người kế nhiệm” của chính chúng, trong khi vai trò của con người giảm dần ở mọi bước. Khi AI lựa chọn thí nghiệm nào đáng chạy—không chỉ chạy—con người sẽ mất vai trò có ý nghĩa cuối cùng trong vòng lặp phát triển, theo báo cáo. Những sai lệch nhỏ có thể nhìn thấy trong các mô hình ngày nay có thể nhân lên qua các thế hệ tự cải thiện cho đến khi không ai có thể sửa chúng nữa.
Năm 2023, hơn một trăm tên tuổi lớn trong cộng đồng nghiên cứu AI đã ký một thư ngỏ kêu gọi nỗ lực toàn cầu nhằm giảm thiểu rủi ro tuyệt chủng mà việc phát triển AI vốn nội tại có. Vài tháng trước đó, một thư ngỏ khác lại yêu cầu OpenAI tạm dừng các tiến bộ đối với ChatGPT do tính chất nguy hiểm của nó. Không ai dừng lại sau thư ngỏ năm 2023. OpenAI không dừng. Anthropic cũng không.
Anthropic triển khai gì tại NSA?
Theo Financial Times đưa tin hôm thứ Năm, Anthropic đã cài khoảng 6 kỹ sư tại Cơ quan An ninh Quốc gia để triển khai mô hình AI Mythos của mình cho các hoạt động tấn công mạng. Các kỹ sư đang tùy biến mô hình cho các ứng dụng cụ thể, có thể bao gồm xâm nhập các mạng lưới ở Trung Quốc và Iran.
Vì sao Anthropic kiện Lầu Năm Góc?
Anthropic đang khởi kiện Lầu Năm Góc sau khi Bộ trưởng Quốc phòng Pete Hegseth gắn nhãn công ty là rủi ro chuỗi cung ứng vào cuối tháng 2, sau sự sụp đổ của một hợp đồng trị giá 200 triệu USD. Anthropic từ chối cho phép Bộ Quốc phòng sử dụng Claude cho vũ khí hoàn toàn tự động hoặc giám sát hàng loạt trong nước. Một thẩm phán ở California đã chặn việc đưa vào danh sách đen như một hành vi trả đũa theo Tu chính án thứ Nhất, trong khi tòa phúc thẩm D.C. từ chối yêu cầu của Anthropic nhằm tạm dừng việc gắn nhãn trong lúc vụ kiện đang diễn ra.
Claude viết bao nhiêu mã cho Anthropic?
Hiện Claude viết hơn 80% mã được hợp nhất vào cơ sở mã sản xuất của Anthropic, tăng từ mức chỉ ở dưới vài chữ số đơn lẻ trước khi Claude Code ra mắt vào đầu năm 2025. Theo báo cáo “When AI Builds Itself” của Anthropic—được công bố bởi viện nghiên cứu nội bộ của công ty—các kỹ sư phát hành khoảng gấp 8 lần lượng mã mỗi ngày so với năm 2024.
Tin tức liên quan
Anthropic nộp hồ sơ IPO kín, thử nghiệm nhu cầu định giá AI
Anthropic kêu gọi làm chậm AI toàn cầu giữa rủi ro tự cải thiện đệ quy
Cổ phiếu CrowdStrike giảm 7% dù nhu cầu an ninh mạng được thúc đẩy bởi Mythos
Báo cáo của Anthropic: Tỷ lệ thắng của AI khi ra quyết định tăng lên 64%, tối ưu mã gấp 52 lần
Trí tuệ nhân tạo Anthropic Claude viết 80% mã nguồn sản xuất tính đến tháng 5 năm 2026