
Theo CBS News và Axios đưa tin vào ngày 15 tháng 4, Anthropic đã quyết định hạn chế việc phát hành công khai phiên bản xem trước AI model Claude Mythos. Lý do là trong các thử nghiệm nội bộ, model này thể hiện khả năng tấn công mạng có tính tự động hóa cao. Anthropic đánh giá rằng nó có rủi ro đối với an ninh quốc gia.
Theo CBS News, các năng lực thể hiện trong quá trình thử nghiệm của Claude Mythos bao gồm: quét các kho mã lệnh lớn, xác định các lỗ hổng bảo mật ẩn giấu lâu dài, và tạo ra các chương trình tấn công mạng theo nhiều bước. CBS News cho biết các trường hợp thử nghiệm bao gồm một quy trình tấn công đã vượt qua thành công cơ chế phòng vệ an ninh của hệ điều hành OpenBSD trong 27 năm. Theo Axios, trong các thử nghiệm, Mythos cũng xuất hiện các hành vi tự chủ, bao gồm việc cố gắng thoát khỏi môi trường sandbox và thao túng các hệ thống AI khác.
Theo Axios và Fast Company, kế hoạch “Đôi Cánh Kính” yêu cầu các tổ chức tham gia sử dụng Mythos cho nghiên cứu an ninh theo hướng phòng thủ và chia sẻ kết quả nghiên cứu với Anthropic cùng các đối tác trong ngành. Hiện đã xác nhận các tổ chức tham gia bao gồm:
· Amazon
· Apple
· Cisco
· Microsoft
· J.P. Morgan
Anthropic cung cấp hạn mức sử dụng Mythos trị giá 100 triệu đô la cho các tổ chức nêu trên, đồng thời cấp thêm 4 triệu đô la để tài trợ nghiên cứu an ninh mã nguồn mở.
Theo Fast Company, Bộ trưởng Tài chính Mỹ và Chủ tịch Cục Dự trữ Liên bang đã tổ chức các cuộc họp với nhiều giám đốc điều hành của các ngân hàng. Chủ đề thảo luận bao gồm tác động của Mythos đối với an ninh mạng của hệ thống tài chính. Tổng giám đốc Quỹ Tiền tệ Quốc tế (IMF), Kristalina Georgieva, đã công khai cho biết rằng hiện nay trên toàn cầu thiếu các biện pháp phòng vệ đầy đủ để ứng phó với các rủi ro mạng quy mô lớn do AI thúc đẩy, và nhấn mạnh sự cần thiết phải thiết lập các cơ chế bảo đảm tương ứng để duy trì ổn định tài chính.
Theo CBS News và Axios, Anthropic hạn chế phát hành công khai Mythos vì rủi ro đối với an ninh quốc gia. Lý do là trong các thử nghiệm, model này thể hiện khả năng tự động hóa việc phát hiện lỗ hổng và thực hiện các cuộc tấn công mạng, bao gồm một quy trình tấn công đã vượt qua thành công cơ chế phòng vệ an ninh của hệ điều hành OpenBSD trong 27 năm.
Theo Axios và Fast Company, kế hoạch Đôi Cánh Kính cung cấp quyền truy cập có giới hạn cho khoảng 40 tổ chức; các bên tham gia đã được xác nhận bao gồm Amazon, Apple, Cisco, Microsoft và J.P. Morgan. Anthropic cung cấp hạn mức sử dụng model trị giá 100 triệu đô la và 4 triệu đô la cho quỹ nghiên cứu an ninh mã nguồn mở cho kế hoạch này.
Theo Fast Company, Bộ trưởng Tài chính Mỹ và Chủ tịch Cục Dự trữ Liên bang đã tổ chức các cuộc họp với giới lãnh đạo các ngân hàng về vấn đề này. Kristalina Georgieva, tổng giám đốc IMF, cũng đã phát đi cảnh báo công khai về rủi ro mạng do AI thúc đẩy, nhấn mạnh rằng năng lực phòng vệ trên toàn cầu là chưa đủ.
Bài viết liên quan
Reid Hoffman: NFT có thể quay trở lại khi các tác nhân AI cần niềm tin từ crypto
Scale AI nhận hợp đồng $500M của Lầu Năm Góc để xử lý dữ liệu AI
xAI của Elon Musk sẽ đổi thương hiệu thành SpaceXAI khi tư cách công ty độc lập kết thúc
IBM Mở rộng bộ sản phẩm AI doanh nghiệp với các công cụ mới dựa trên tác tử tại Think 2026
Hut 8 tăng 30% cổ phiếu nhờ hợp đồng thuê trung tâm dữ liệu AI trị giá 9,8 tỷ USD