Công cụ AI Claude Mythos là gì và đâu là những rủi ro tiềm ẩn?

Một số "ông lớn" công nghệ đã được cấp quyền truy cập Mythos thông qua sáng kiến Project Glasswing, nhằm tăng cường khả năng chống chịu trước chính công nghệ này

Nguồn hình ảnh, Reuters

Chụp lại hình ảnh, Một số "ông lớn" công nghệ đã được cấp quyền truy cập Mythos thông qua sáng kiến Project Glasswing, nhằm tăng cường khả năng chống chịu trước chính công nghệ này
    • Tác giả, Liv McMahon
    • Vai trò, Phóng viên chuyên về công nghệ
    • Tác giả, Joe Tidy
    • Vai trò, Phóng viên chuyên về mạng, BBC World Service
  • Thời gian đọc: 9 phút

Trong những tuần gần đây, giới công nghệ trí tuệ nhân tạo (AI) xôn xao trước các tuyên bố của doanh nghiệp đầu ngành Anthropic về mô hình mới mang tên Claude Mythos.

Công ty cho biết công cụ này có thể vượt qua con người trong một số tác vụ liên quan đến hacking và an ninh mạng, điều này đã làm dấy lên các cuộc thảo luận giữa giới quản lý, nhà lập pháp và các tổ chức tài chính về những nguy cơ mà nó có thể gây ra đối với các hệ thống số.

Một số "ông lớn" công nghệ đã được cấp quyền truy cập Mythos thông qua sáng kiến Project Glasswing, nhằm tăng cường khả năng chống chịu trước chính công nghệ này.

Tuy nhiên, cũng có ý kiến cho rằng việc nhấn mạnh năng lực chưa từng có của Mythos là có lợi cho Anthropic, và như thường lệ với AI, việc phân biệt giữa tuyên bố chính đáng và những lời đồn thổi không hề dễ dàng.

Claude Mythos là gì?

Mythos là một trong những mô hình mới nhất của Anthropic và được phát triển dưới dạng một phần của hệ thống AI rộng hơn mang tên Claude.

Nó bao gồm trợ lý AI và cả một họ mô hình của công ty, cạnh tranh với ChatGPT của OpenAI và Gemini của Google.

Mô hình này được Anthropic công bố vào đầu tháng Tư với tên gọi "Mythos Preview".

Các nhà nghiên cứu chuyên kiểm tra cách các mô hình AI xử lý các yêu cầu hoặc tác vụ cụ thể – thường được gọi là "red-team" – cho biết trong một báo cáo rằng Mythos "có năng lực đáng kinh ngạc trong các tác vụ an ninh máy tính".

Họ phát hiện công cụ này có thể tìm ra các lỗi tiềm ẩn (bug) tồn tại trong những đoạn mã hàng chục năm tuổi và dễ dàng tận dụng chúng.

Vì vậy, thay vì cung cấp một cách rộng rãi Mythos cho người dùng Claude, Anthropic đã cấp quyền truy cập cho 12 công ty công nghệ thông qua sáng kiến Project Glasswing, mà họ mô tả là "một nỗ lực nhằm bảo vệ những phần mềm quan trọng nhất thế giới".

Các đối tác bao gồm gã khổng lồ điện toán đám mây Amazon Web Services, các nhà sản xuất thiết bị như Apple, Microsoft, Google và các hãng sản xuất chip như Nvidia, Broadcom.

CrowdStrike, công ty từng gây ra sự cố gián đoạn toàn cầu lớn vào tháng 7/2024 do một bản cập nhật lỗi, cũng nằm trong số các đối tác.

Anthropic cho biết họ còn cấp quyền truy cập Mythos cho hơn 40 tổ chức chịu trách nhiệm về những phần mềm trọng yếu.

Trong một video được công bố cùng thời điểm ra mắt Project Glasswing, CEO của Anthropic, ông Dario Amodei cho biết công ty đã đề nghị hợp tác với các quan chức chính phủ Mỹ nhằm "giúp phòng vệ trước những rủi ro từ các mô hình này".

Theo trang tin Axios của Mỹ, ông Amodei đã có buổi thảo luận với Bộ trưởng Tài chính Scott Bessent và Chánh văn phòng Nhà Trắng Susie Wiles vào hôm 17/4.

Nhà Trắng cho biết đã có một cuộc gặp "hiệu quả và mang tính xây dựng" với người đứng đầu công ty trí tuệ nhân tạo Anthropic – đơn vị hiện đang kiện Bộ Quốc phòng Mỹ.

Đại diện của Anthropic chưa đưa ra bình luận nào về cuộc gặp này.

Đáng chú ý, cuộc thảo luận diễn ra chỉ hai tháng sau khi Nhà Trắng từng chế nhạo công ty này là một tổ chức cực tả "thức tỉnh" (woke – một từ tiếng lóng trong tiếng Anh ám chỉ những người nhận thức được các vấn đề chính trị và xã hội).

Cuộc gặp hôm 17/4 là một tín hiệu cho thấy công nghệ của Anthropic có thể đóng vai trò quá quan trọng, khiến ngay cả chính phủ Mỹ cũng không thể ngó lơ – bất chấp lập trường cứng rắn của chính quyền ông Trump đối với công ty này.

Nhà Trắng cho biết: "Chúng tôi đã thảo luận về các cơ hội hợp tác, cũng như những phương thức và quy trình chung nhằm giải quyết các thách thức nảy sinh khi mở rộng quy mô công nghệ này."

Thông cáo của Nhà Trắng cho biết thêm rằng cuộc gặp đã "thăm dò sự cân bằng giữa việc thúc đẩy đổi mới sáng tạo và đảm bảo tính an toàn".

Vì sao có những lo ngại?

Anthropic cho biết trong các thử nghiệm, họ phát hiện mô hình này có kỹ năng rất cao trong các tác vụ an ninh mạng và hacking, thậm chí vượt con người.

"Mythos Preview đã phát hiện hàng ngàn lỗ hổng nghiêm trọng, bao gồm cả trong mọi hệ điều hành lớn và trình duyệt web," Anthropic tuyên bố ngày 7/4.

"Với tốc độ phát triển của AI, sẽ không mất nhiều thời gian trước khi những năng lực như vậy lan rộng, có thể vượt khỏi tầm kiểm soát của những người cam kết sử dụng chúng một cách an toàn."

Công ty cho biết mô hình có thể – trong bối cảnh không cần giám sát nhiều – phát hiện các lỗ hổng nghiêm trọng trong các hệ thống cũ cần được xử lý ngay lập tức, bao gồm một lỗ hổng đã tồn tại suốt 27 năm, và đề xuất cách tận dụng chúng.

Nỗi lo ngại của công chúng về năng lực của AI đã dẫn đến một cuộc biểu tình tại San Francisco vào tháng Ba

Nguồn hình ảnh, Reuters

Chụp lại hình ảnh, Nỗi lo ngại của công chúng về năng lực của AI đã dẫn đến một cuộc biểu tình tại San Francisco vào tháng Ba

Kể từ đó, một số bộ trưởng tài chính, thống đốc ngân hàng trung ương và các nhà tài chính đã bày tỏ lo ngại nghiêm trọng, cho rằng mô hình này có thể làm suy yếu an ninh của các hệ thống tài chính.

Bộ trưởng Tài chính Canada François-Philippe Champagne nói với BBC rằng Mythos đã được thảo luận tại cuộc họp của Quỹ Tiền tệ Quốc tế ở Washington DC trong tuần này.

"Chắc chắn đây là vấn đề đủ nghiêm trọng để tất cả các bộ trưởng tài chính phải quan tâm," ông nói, mô tả công nghệ này là một "ẩn số của những ẩn số".

Thống đốc Ngân hàng Anh Andrew Bailey nói với BBC: "Chúng tôi hiện phải xem xét rất kỹ xem bước phát triển AI mới nhất này có thể ảnh hưởng thế nào đến nguy cơ tội phạm mạng."

Trong khi đó, Liên minh châu Âu cho biết họ cũng đang trao đổi với Anthropic về những lo ngại liên quan đến Mythos.

Các chuyên gia an ninh mạng nói gì?

Ông Ciaran Martin, cựu lãnh đạo Trung tâm An ninh mạng quốc gia Anh, nói với BBC hồi đầu tuần rằng tuyên bố Mythos có thể phát hiện các lỗ hổng nghiêm trọng nhanh hơn nhiều so với các mô hình AI khác đã "thực sự khiến nhiều người chấn động".

"Điểm thứ hai là, ngay cả với những điểm yếu mà chúng đã biết đang tồn tại, các tổ chức vẫn chưa sửa chữa [các điểm yếu] tốt hoặc có thể được trang bị một cách hiệu quả, nó [Mythos] đơn giản là một hacker rất giỏi," ông nói.

Nhiều nhà phân tích và chuyên gia an ninh mạng độc lập vẫn chưa thể tự mình kiểm nghiệm mô hình này, và một số vẫn hoài nghi về hiệu năng của Mythos.

Viện An toàn AI của Anh gần đây kết luận rằng, dù là một mô hình rất mạnh, mối đe dọa lớn nhất của nó sẽ là đối với các hệ thống phòng thủ yếu, dễ bị tổn thương.

"Chúng tôi chưa thể khẳng định chắc chắn liệu Mythos Preview có thể tấn công các hệ thống được bảo vệ tốt hay không," các nhà nghiên cứu cho biết.

Do đó, ở những nơi có an ninh mạng tốt, về lý thuyết, mô hình này có thể sẽ bị ngăn chặn.

Chúng ta có nên lo lắng?

Những lo ngại liên quan đến AI không phải là điều mới.

Các mô hình và công cụ mới liên tục xuất hiện, và thường đi kèm những lời hứa hẹn sẽ thay đổi cuộc sống của chúng ta – theo cả hướng tích cực lẫn tiêu cực.

Việc tận dụng sự pha trộn giữa lo ngại và kỳ vọng về AI và tác động tương lai của nó cũng đã trở thành đặc trưng trong chiến lược truyền thông của ngành này trong những năm gần đây.

Trong trường hợp của Mythos, chúng ta vẫn chưa có đủ thông tin để biết liệu những kỳ vọng hay nỗi lo này là có cơ sở, hay chỉ phản ánh "làn sóng thổi phồng" về ngành.

Giám đốc điều hành Anthropic, Dario Amodei, từng cảnh báo về nguy cơ lạm dụng các sản phẩm của công ty

Nguồn hình ảnh, Reuters

Chụp lại hình ảnh, Giám đốc điều hành Anthropic, Dario Amodei, từng cảnh báo về nguy cơ lạm dụng các sản phẩm của công ty

Dù thế nào, theo Trung tâm An ninh mạng Quốc gia Anh, điều quan trọng nhất hiện nay là không hoảng loạn, mà tập trung vào việc đảm bảo các nền tảng an ninh mạng cơ bản.

Xét cho cùng, phần lớn hacker không cần đến các công cụ AI siêu mạnh để xâm nhập hệ thống, khi những cuộc tấn công đơn giản hơn thường đã đủ hiệu quả.

"Với một số người, đây là một sự kiện mang tính tận thế; với người khác, nó dường như chỉ là sự cường điệu," ông Martin nói với BBC.

Tuy nhiên, ông cho rằng dù là công cụ này hay các công cụ tiếp theo do Anthropic hoặc các đối thủ cạnh tranh phát triển, thì bên cạnh rủi ro vẫn tồn tại một cơ hội để xây dựng một môi trường trực tuyến an toàn hơn.

"Trong trung hạn, những công cụ này có thể được sử dụng để khắc phục nhiều lỗ hổng nền tảng của internet," ông nói.

Phóng viên chuyên về công nghệ Liv McMahon, Phóng viên chuyên về mạng của BBC World Service Joe Tidy, Phóng viên chuyên về công nghệ Kali Hays, Phóng viên chuyên về công nghệ ở Bắc Mỹ Lily Jamali tường thuật cho bài viết này