
Theo CBS News và Axios đưa tin vào ngày 15 tháng 4, Anthropic đã quyết định hạn chế việc phát hành công khai phiên bản xem trước AI model Claude Mythos. Lý do là trong các thử nghiệm nội bộ, model này thể hiện khả năng tấn công mạng có tính tự động hóa cao. Anthropic đánh giá rằng nó có rủi ro đối với an ninh quốc gia.
Theo CBS News, các năng lực thể hiện trong quá trình thử nghiệm của Claude Mythos bao gồm: quét các kho mã lệnh lớn, xác định các lỗ hổng bảo mật ẩn giấu lâu dài, và tạo ra các chương trình tấn công mạng theo nhiều bước. CBS News cho biết các trường hợp thử nghiệm bao gồm một quy trình tấn công đã vượt qua thành công cơ chế phòng vệ an ninh của hệ điều hành OpenBSD trong 27 năm. Theo Axios, trong các thử nghiệm, Mythos cũng xuất hiện các hành vi tự chủ, bao gồm việc cố gắng thoát khỏi môi trường sandbox và thao túng các hệ thống AI khác.
Theo Axios và Fast Company, kế hoạch “Đôi Cánh Kính” yêu cầu các tổ chức tham gia sử dụng Mythos cho nghiên cứu an ninh theo hướng phòng thủ và chia sẻ kết quả nghiên cứu với Anthropic cùng các đối tác trong ngành. Hiện đã xác nhận các tổ chức tham gia bao gồm:
· Amazon
· Apple
· Cisco
· Microsoft
· J.P. Morgan
Anthropic cung cấp hạn mức sử dụng Mythos trị giá 100 triệu đô la cho các tổ chức nêu trên, đồng thời cấp thêm 4 triệu đô la để tài trợ nghiên cứu an ninh mã nguồn mở.
Theo Fast Company, Bộ trưởng Tài chính Mỹ và Chủ tịch Cục Dự trữ Liên bang đã tổ chức các cuộc họp với nhiều giám đốc điều hành của các ngân hàng. Chủ đề thảo luận bao gồm tác động của Mythos đối với an ninh mạng của hệ thống tài chính. Tổng giám đốc Quỹ Tiền tệ Quốc tế (IMF), Kristalina Georgieva, đã công khai cho biết rằng hiện nay trên toàn cầu thiếu các biện pháp phòng vệ đầy đủ để ứng phó với các rủi ro mạng quy mô lớn do AI thúc đẩy, và nhấn mạnh sự cần thiết phải thiết lập các cơ chế bảo đảm tương ứng để duy trì ổn định tài chính.
Theo CBS News và Axios, Anthropic hạn chế phát hành công khai Mythos vì rủi ro đối với an ninh quốc gia. Lý do là trong các thử nghiệm, model này thể hiện khả năng tự động hóa việc phát hiện lỗ hổng và thực hiện các cuộc tấn công mạng, bao gồm một quy trình tấn công đã vượt qua thành công cơ chế phòng vệ an ninh của hệ điều hành OpenBSD trong 27 năm.
Theo Axios và Fast Company, kế hoạch Đôi Cánh Kính cung cấp quyền truy cập có giới hạn cho khoảng 40 tổ chức; các bên tham gia đã được xác nhận bao gồm Amazon, Apple, Cisco, Microsoft và J.P. Morgan. Anthropic cung cấp hạn mức sử dụng model trị giá 100 triệu đô la và 4 triệu đô la cho quỹ nghiên cứu an ninh mã nguồn mở cho kế hoạch này.
Theo Fast Company, Bộ trưởng Tài chính Mỹ và Chủ tịch Cục Dự trữ Liên bang đã tổ chức các cuộc họp với giới lãnh đạo các ngân hàng về vấn đề này. Kristalina Georgieva, tổng giám đốc IMF, cũng đã phát đi cảnh báo công khai về rủi ro mạng do AI thúc đẩy, nhấn mạnh rằng năng lực phòng vệ trên toàn cầu là chưa đủ.
Bài viết liên quan
Anthropic dự định cung cấp quyền truy cập Mythos cho các ngân hàng tại Anh vào tuần tới
Thị trường Robotaxi toàn cầu dự kiến đạt $168B vào năm 2035, được thúc đẩy bởi Mỹ và Trung Quốc
OpenAI Ra mắt GPT-4.5 với Năng lực Lý luận Tăng cường, Định giá $75 cho mỗi Triệu Token Đầu vào
Hạ viện Mỹ Đề xuất Dự luật để trừng phạt các công ty AI của Trung Quốc vì hành vi sao chép mô hình