Theo thông tin từ Bloomberg được công bố vào ngày Thứ Năm, chính phủ Mỹ đang chuẩn bị cấp cho các cơ quan liên bang quyền truy cập vào mô hình Mythos của Anthropic. Gregory Barbaccia, giám đốc công nghệ thông tin cấp liên bang tại Văn phòng Quản lý và Ngân sách của Nhà Trắng (OMB), đã gửi một email vào Thứ Ba cho các quan chức của các bộ ngành thuộc Nội các, cho biết OMB đang thiết lập các biện pháp bảo vệ để cho phép các cơ quan sử dụng mô hình này. Mô hình Mythos bị giới hạn đối với một số nhóm nhất định và nhằm phục vụ công việc an ninh mạng phòng thủ, không phải sử dụng thương mại rộng rãi.
Trong email của OMB với dòng chủ đề “Mythos Model Access”, Barbaccia viết: “Chúng tôi đang phối hợp chặt chẽ với các nhà cung cấp mô hình, các đối tác trong ngành khác và cộng đồng tình báo để đảm bảo các hàng rào bảo vệ và biện pháp an toàn phù hợp được đặt ra trước khi có khả năng phát hành một phiên bản đã được chỉnh sửa của mô hình cho các cơ quan.”
Kế hoạch triển khai được đưa ra trong bối cảnh các quan chức bày tỏ lo ngại về rủi ro an ninh mạng nếu công cụ này không được kiểm soát chặt chẽ. Anthropic đã cho biết năng lực của Mythos có thể lan nhanh và không ở trong tay những người có đủ năng lực quản lý an toàn, cảnh báo rằng: “Hậu quả đối với các nền kinh tế, an toàn công cộng và an ninh quốc gia có thể rất nghiêm trọng” nếu những năng lực như vậy lan ra ngoài phạm vi các tác nhân cam kết triển khai an toàn.
Kế hoạch triển khai trên phạm vi liên bang trùng thời điểm với sự quan tâm quốc tế gia tăng đối với rủi ro an ninh mạng trong lĩnh vực AI. Các bộ trưởng tài chính, thống đốc ngân hàng trung ương và các cơ quan quản lý đã tập trung tại Washington cho các cuộc họp mùa xuân của IMF và Ngân hàng Thế giới, nơi các quan chức tài chính cấp cao cảnh báo rằng AI tiên tiến từ các công ty công nghệ của Mỹ có thể làm lộ ra các lỗ hổng trong phòng thủ an ninh mạng của các bên cho vay và gây áp lực lên hệ thống ngân hàng rộng lớn hơn.
Andrew Bailey, thống đốc Ngân hàng Anh và là chủ tịch Hội đồng Ổn định Tài chính, cho biết: “Đây là một thách thức rất nghiêm trọng đối với tất cả chúng ta. Nó nhắc chúng ta về tốc độ mà thế giới AI vận động.” Bailey nói rằng các cơ quan quản lý trên toàn thế giới sẽ cần nhanh chóng đánh giá rủi ro mạng mà bản xem trước Claude Mythos của Anthropic có thể gây ra cho hệ thống tài chính.
Dan Katz, quyền lãnh đạo phụ trách của IMF, cho biết: “Sự phát triển của công nghệ số đang tạo ra những rủi ro khổng lồ từ góc độ an ninh mạng. Điều này thực sự sẽ là điều hoàn toàn thiết yếu trong chương trình nghị sự quốc tế của vài tháng tới.”
Christine Lagarde, chủ tịch Ngân hàng Trung ương châu Âu, nhấn mạnh mối lo ngại về sử dụng kép: “Những gì chúng ta đã thấy với Anthropic và Mythos là một ví dụ tốt về một công ty có trách nhiệm, đột nhiên nghĩ rằng: ‘à, điều đó có thể thực sự rất tốt’, nhưng nếu nó rơi vào tay sai thì nó có thể thực sự rất tệ.” Lagarde nói với các phóng viên rằng các quan chức muốn một khung quản trị, nhưng hiện không có hệ thống chính thức nào được thiết lập: “Ai cũng háo hức muốn có một khung để hoạt động. Tôi không nghĩ có một khung quản trị thực sự được thiết kế để canh chừng những điều đó. Chúng ta cần làm việc để xây dựng điều đó.”
Anthropic đã công bố sớm hơn trong tháng này rằng Mythos đã tìm thấy “hàng nghìn lỗ hổng có mức độ nghiêm trọng cao, bao gồm một số trong mọi hệ điều hành lớn và trình duyệt web.” Công ty cảnh báo rằng các năng lực như vậy có thể lan nhanh và không ở trong tay những người có đủ khả năng đảm bảo an toàn, nêu rõ: “Sẽ không lâu nữa trước khi những năng lực như vậy lan rộng, có thể vượt ra ngoài các tác nhân cam kết triển khai chúng một cách an toàn.”
Pip White, người đứng đầu của Anthropic phụ trách Vương quốc Anh, Ireland và Bắc Âu, cho biết sự quan tâm từ các lãnh đạo đã tăng nhanh chóng sau tin tức về mô hình. Trong một cuộc phỏng vấn, White cho biết: “Chúng tôi đang đặt ra các biện pháp bảo vệ của riêng mình và các giới hạn riêng đối với sản phẩm này, bởi vì chúng tôi biết nó mạnh mẽ đến mức nào.”
Vào ngày Thứ Năm, Anthropic đã phát hành Opus 4.7, một mô hình mới được thiết kế cho các tác vụ kỹ thuật phần mềm. Theo công ty, Opus 4.7 có thể xử lý các công việc lập trình mà trước đây cần được giám sát chặt chẽ hơn, tuân thủ hướng dẫn tốt hơn các mô hình cũ, và phân tích các hình ảnh có độ phân giải cao hơn để nhận diện chi tiết trong các biểu đồ dày đặc và các bức hình phức tạp.
Anthropic cho biết Opus 4.7 kém năng lực hơn Mythos, bao gồm cả trong các tình huống sử dụng liên quan đến an ninh mạng. Trong quá trình huấn luyện, công ty đã thử nghiệm các phương pháp để “giảm có điều độ” khả năng an ninh mạng của mô hình.