Dự án Glasswing: Chương trình An ninh mạng AI của Anthropic (2026)

Q: "Glasswing" có nghĩa là gì?

Cái tên này bắt nguồn từ loài bướm cánh thủy tinh (*Greta oto*), loài có đôi cánh gần như trong suốt. Phép ẩn dụ ở đây là sự minh bạch — cả trong cách tiếp cận của Anthropic khi công bố toàn bộ system card và trong mục tiêu làm cho cơ sở hạ tầng phần mềm trở nên rõ ràng và an toàn hơn.

TL;DR

Chi tiết	Dự án Glasswing
Là gì	Sáng kiến an ninh mạng phòng thủ của Anthropic
Vận hành bởi	Claude Mythos Preview — mô hình mạnh mẽ nhất của Anthropic
Khả năng cốt lõi	Tự động phát hiện và khai thác các lỗ hổng zero-day
Phạm vi	Tìm thấy hàng nghìn lỗ hổng zero-day trên mọi hệ điều hành và trình duyệt lớn
Truy cập công khai	Không có — mô hình đầu tiên của Anthropic không bao giờ được phát hành rộng rãi
Đối tác	AWS, Apple, Microsoft, Google, NVIDIA, Cisco, CrowdStrike, JPMorgan Chase, Broadcom, Palo Alto Networks, Linux Foundation
Cam kết tài chính	100 triệu USD dưới dạng credit sử dụng + 4 triệu USD quyên góp cho bảo mật nguồn mở
Công bố	Ngày 7 tháng 4 năm 2026

Dự án Glasswing là gì?

Dự án Glasswing là sáng kiến của Anthropic nhằm sử dụng AI để xác định và khắc phục các lỗ hổng an ninh mạng chưa được phát hiện trong các phần mềm quan trọng — ở một quy mô mà không nhóm người nào có thể sánh kịp.

Được đặt tên theo loài bướm cánh thủy tinh (glasswing butterfly - nổi tiếng với đôi cánh trong suốt, tượng trưng cho sự minh bạch trong bảo mật), dự án được xây dựng trên Claude Mythos Preview, một mô hình tiên phong mà Anthropic coi là quá mạnh mẽ để phát hành công khai.

Tiền đề rất đơn giản: nếu các mô hình AI thế hệ tiếp theo có thể tự động tìm và khai thác các lỗ hổng bảo mật, thì những người phòng thủ cần có quyền truy cập vào các khả năng tương tự trước khi những kẻ tấn công tự xây dựng công cụ riêng. Thay vì phát hành Mythos Preview ra thế giới và hy vọng điều tốt đẹp nhất, Anthropic đã chọn triển khai nó như một công cụ phòng thủ cho các tổ chức duy trì các phần mềm mà thế giới đang phụ thuộc vào.

Điều này biến Dự án Glasswing thành một chương trình đầu tiên thuộc loại này — một công ty AI cố tình hạn chế quyền truy cập vào mô hình tiên tiến nhất của mình và hướng các khả năng của nó vào một nhiệm vụ phòng thủ cụ thể.

Tại sao Dự án Glasswing tồn tại?

Trong quá trình thử nghiệm nội bộ, Anthropic đã phát hiện ra rằng Claude Mythos Preview có thể làm được điều mà chưa mô hình AI nào trước đây thể hiện được: tự động phát hiện và khai thác các lỗ hổng zero-day trong các phần mềm sản xuất thực tế.

Từ bản system card dài 244 trang được công bố vào ngày 7 tháng 4 năm 2026:

"Claude Mythos Preview đã thể hiện một bước nhảy vọt đáng kinh ngạc về khả năng mạng so với các mô hình trước đó, bao gồm khả năng tự động phát hiện và khai thác các lỗ hổng zero-day trong các hệ điều hành và trình duyệt web lớn."

Từ khóa ở đây là "tự động". Các mô hình AI trước đây có thể hỗ trợ nghiên cứu lỗ hổng khi được các chuyên gia hướng dẫn. Mythos Preview có thể tự chạy toàn bộ quy trình — đọc mã nguồn, đưa ra các giả thuyết về các lỗi tiềm ẩn, viết các mã khai thác proof-of-concept và tạo ra các báo cáo lỗi đầy đủ với các bước tái hiện.

Anthropic nhận ra rằng nếu mô hình của họ có thể làm được điều này, thì việc các khả năng tương tự xuất hiện ở nơi khác chỉ là vấn đề thời gian. Câu hỏi đặt ra là: chúng ta nên tạo lợi thế dẫn đầu cho những người phòng thủ, hay chúng ta chờ đợi và hy vọng?

Họ đã chọn tạo lợi thế dẫn đầu.

Khả năng mạng: Mythos Preview thực sự có thể làm được gì?

Kết quả từ các thử nghiệm của Anthropic rất đáng chú ý cả về chiều rộng lẫn chiều sâu.

Hàng nghìn lỗ hổng Zero-Day trên các cơ sở hạ tầng quan trọng

Trong khoảng thời gian vài tuần, Claude Mythos Preview đã xác định được hàng nghìn lỗ hổng chưa từng biết đến trước đây — nhiều lỗ hổng trong số đó được xếp hạng nghiêm trọng — trong:

Mọi hệ điều hành lớn (Windows, macOS, Linux, FreeBSD, OpenBSD)
Mọi trình duyệt web lớn (Chrome, Firefox, Safari, Edge)
Các thành phần cơ sở hạ tầng phần mềm quan trọng khác

Hơn 99% các lỗ hổng được phát hiện vẫn chưa được vá, đó là lý do tại sao Anthropic chỉ tiết lộ một số ví dụ cụ thể.

Các lỗ hổng cụ thể đã được công bố

Trong số các lỗi đã được vá và có thể thảo luận công khai:

CVE-2026-4747 — Một lỗ hổng thực thi mã từ xa đã tồn tại 17 năm trong FreeBSD. Lỗi này tồn tại trong triển khai NFS và cho phép kẻ tấn công chưa được xác thực từ bất kỳ đâu trên internet giành được quyền root. Mythos Preview đã tìm thấy nó và xây dựng một bản khai thác hoạt động hoàn toàn tự động.

Một lỗi 27 năm tuổi trong OpenBSD — đáng chú ý vì OpenBSD là một hệ thống mà toàn bộ danh tiếng được xây dựng xung quanh tính bảo mật. Đây là lỗ hổng lâu đời nhất mà mô hình này phát hiện ra.

Một lỗ hổng 16 năm tuổi trong codec H.264 của FFmpeg — ảnh hưởng đến một trong những thư viện xử lý đa phương tiện được triển khai rộng rãi nhất trên thế giới.

Phát triển khai thác nâng cao

Mythos Preview không chỉ tìm thấy lỗi. Nó còn liên kết chúng lại thành các chuỗi tấn công tinh vi:

Trong một trường hợp, nó đã viết một bản khai thác trình duyệt web liên kết bốn lỗ hổng riêng biệt, bao gồm một kỹ thuật JIT heap spray giúp thoát khỏi cả sandbox của trình kết xuất (renderer) và sandbox của hệ điều hành.
Nó tự động phát triển các bản khai thác leo thang đặc quyền cục bộ trên Linux bằng cách khai thác các điều kiện race condition tinh vi và các kỹ thuật vượt qua KASLR.
Nó tạo ra các bản khai thác proof-of-concept hoàn chỉnh với các bước tái hiện, được định dạng như các báo cáo lỗi chuyên nghiệp sẵn sàng để các nhà phát triển phân loại và xử lý.

Cách thức hoạt động về mặt kỹ thuật

Anthropic chạy Mythos Preview thông qua Claude Code — môi trường lập trình dạng agent của họ. Mô hình được nhắc lệnh để tìm các lỗ hổng bảo mật, và sau đó thực hiện một cách tự chủ:

Đọc mã nguồn để hiểu bề mặt tấn công
Đưa ra giả thuyết về các lỗ hổng tiềm ẩn dựa trên các mẫu mã (code patterns)
Viết các bộ khung kiểm thử (test harnesses) và mã khai thác để xác nhận các giả thuyết của nó
Tạo ra các báo cáo lỗi có cấu trúc với các bản khai thác proof-of-concept hoạt động được

Quy trình này tự động từ đầu đến cuối. Không cần con người hướng dẫn qua từng bước riêng lẻ.

Các đối tác là ai?

Dự án Glasswing ra mắt với 12 đối tác sáng lập và kể từ đó đã mở rộng lên hơn 40 tổ chức.

Đối tác sáng lập

Tổ chức	Vai trò
Amazon Web Services	Nhà cung cấp cơ sở hạ tầng đám mây
Apple	Nhà cung cấp hệ điều hành và trình duyệt
Broadcom	Phần mềm cơ sở hạ tầng và bán dẫn
Cisco	Cơ sở hạ tầng mạng và bảo mật
CrowdStrike	Nền tảng bảo mật điểm cuối
Google	Nhà cung cấp hệ điều hành, trình duyệt và đám mây
JPMorgan Chase	Cơ sở hạ tầng tài chính
Linux Foundation	Đơn vị quản lý hệ sinh thái phần mềm nguồn mở
Microsoft	Nhà cung cấp hệ điều hành, trình duyệt và đám mây
NVIDIA	Cơ sở hạ tầng GPU và AI
Palo Alto Networks	Bảo mật mạng và đám mây

Danh sách đối tác đáng chú ý vì sự đa dạng. Nó bao gồm các nhà cung cấp hệ điều hành (Apple, Microsoft, Google), nhà cung cấp đám mây (AWS, Google, Microsoft), các công ty bảo mật (CrowdStrike, Palo Alto Networks), cơ sở hạ tầng tài chính (JPMorgan Chase) và hệ sinh thái nguồn mở (Linux Foundation).

Tài trợ nguồn mở

Anthropic đã cam kết quyên góp trực tiếp 4 triệu USD cho các tổ chức bảo mật nguồn mở:

2,5 triệu USD cho Alpha-Omega và OpenSSF thông qua Linux Foundation
1,5 triệu USD cho Apache Software Foundation

Điều này rất quan trọng vì phần lớn cơ sở hạ tầng phần mềm quan trọng của thế giới là nguồn mở, được duy trì bởi các nhóm nhỏ với ngân sách bảo mật hạn chế. Khoản tài trợ này giúp các tổ chức này hành động dựa trên các lỗ hổng mà Mythos Preview tìm thấy.

Cam kết 100 triệu USD

Anthropic đang cam kết lên đến 100 triệu USD dưới dạng credit sử dụng cho Mythos Preview trong khuôn khổ Dự án Glasswing.

Con số đó phản ánh bản chất tiêu tốn nhiều tài nguyên tính toán của việc tự động phát hiện lỗ hổng. Chạy Mythos Preview trên hàng triệu dòng mã trong mọi dự án phần mềm lớn là rất tốn kém. Bằng cách cung cấp credit thay vì thu phí các đối tác, Anthropic loại bỏ rào cản chi phí vốn có thể làm chậm công việc phòng thủ.

Để dễ hình dung, 100 triệu USD credit có khả năng tương đương với hàng chục nghìn giờ GPU dành riêng cho việc tìm kiếm và ghi lại các lỗi bảo mật trước khi những kẻ tấn công có thể khai thác chúng.

Tại sao không phát hành mô hình công khai?

Đây là câu hỏi mà mọi người đều đặt ra. Lý lẽ của Anthropic có ba tầng:

1. Rủi ro lưỡng dụng (dual-use) là cực kỳ lớn. Chính khả năng giúp Mythos Preview có giá trị trong phòng thủ — tự động tìm và khai thác zero-day — cũng sẽ khiến nó có giá trị tương đương trong tấn công. Việc phát hành công khai sẽ cung cấp cho mọi kẻ tấn công trên thế giới quyền truy cập vào một công cụ có thể tìm thấy các lỗ hổng có thể khai thác nhanh hơn bất kỳ nhóm người nào có thể vá chúng. 2. Sự bất đối xứng có lợi cho kẻ tấn công. Kẻ tấn công chỉ cần tìm thấy một lỗ hổng. Người phòng thủ cần vá tất cả chúng. Một AI tìm kiếm lỗ hổng có sẵn công khai sẽ làm nghiêng cán cân bất đối xứng này thêm nữa về phía kẻ tấn công, ngay cả khi người phòng thủ cũng có quyền truy cập. 3. Triển khai có kiểm soát mang lại hiệu quả. Bằng cách giới hạn quyền truy cập cho các tổ chức duy trì cơ sở hạ tầng quan trọng, Anthropic đảm bảo rằng đầu ra của mô hình được đưa trực tiếp vào quy trình vá lỗi. Các lỗ hổng được tìm thấy, báo cáo thông qua quy trình công bố có điều phối và được khắc phục — mà không để mã khai thác rò rỉ ra bên ngoài.

Điều này làm cho Claude Mythos Preview trở thành mô hình Anthropic đầu tiên không bao giờ được phát hành rộng rãi. System card đã được công bố đầy đủ (tất cả 244 trang), nhưng chính mô hình này vẫn bị hạn chế.

Phản ứng và lo ngại của ngành

Dự án Glasswing đã thu hút sự chú ý đáng kể trong toàn bộ bối cảnh công nghệ và chính sách.

Đón nhận tích cực

Các nhà nghiên cứu bảo mật và các nhà lãnh đạo trong ngành đã rộng rãi ca ngợi sáng kiến này. Simon Willison lưu ý rằng việc hạn chế Mythos cho các nhà nghiên cứu bảo mật "có vẻ là cần thiết" dựa trên những khả năng được mô tả. Sáng kiến này đã được thảo luận giữa Chủ tịch Cục Dự trữ Liên bang Powell, Bộ trưởng Tài chính Bessent và các CEO ngân hàng lớn của Hoa Kỳ, theo CNBC, phản ánh tầm quan trọng mang tính hệ thống của việc phát hiện lỗ hổng do AI thúc đẩy.

Sự hoài nghi và lo ngại

Không phải ai cũng bị thuyết phục. Một số chuyên gia lâu năm trong ngành lập luận rằng việc tìm kiếm lỗ hổng chưa bao giờ là nút thắt cổ chai — vấn đề thực sự là khiến các tổ chức thực sự bắt tay vào vá lỗi. Như Fortune đã đưa tin, khoảng cách giữa việc phát hiện và khắc phục vẫn là mắt xích yếu nhất trong chuỗi bảo mật.

Những người khác lo ngại về tiền lệ của một công ty AI quyết định tổ chức nào được quyền truy cập vào các khả năng mạnh mẽ và tổ chức nào không. Viện An toàn AI của Vương quốc Anh (AISI) đã công bố đánh giá riêng về các khả năng mạng của Mythos Preview, cung cấp một bản đánh giá độc lập về các tuyên bố này.

Điều gì sẽ xảy ra tiếp theo?

Đây có phải là tiêu chuẩn mới cho AI tiên phong?

Có khả năng là vậy. Khi các mô hình AI trở nên có năng lực hơn, thực hành hạn chế quyền truy cập vào các mô hình có khả năng lưỡng dụng cực đoan có thể sẽ trở thành tiêu chuẩn. Dự án Glasswing là một khuôn mẫu cho cách thức hoạt động này: công bố system card một cách minh bạch, hạn chế chính mô hình đó, hướng các khả năng vào mục đích phòng thủ.

Các công ty AI khác có làm theo không?

OpenAI đã và đang theo đuổi các sáng kiến an ninh mạng của riêng mình, tạo ra điều mà Crypto News mô tả là một "cuộc đua" giữa các công ty AI về các khả năng phòng thủ mạng.

Khi nào các lỗ hổng sẽ được công bố?

Anthropic đang tuân theo các quy trình công bố lỗ hổng có phối hợp tiêu chuẩn. Khi các bản vá được các nhà cung cấp bị ảnh hưởng phát hành, các chi tiết về lỗ hổng tương ứng sẽ được công khai. Với khối lượng lớn — hàng nghìn lỗ hổng zero-day — quá trình này sẽ mất nhiều tháng hoặc lâu hơn.

Câu hỏi thường gặp (FAQ)

"Glasswing" có nghĩa là gì?

Cái tên này bắt nguồn từ loài bướm cánh thủy tinh (Greta oto), loài có đôi cánh gần như trong suốt. Phép ẩn dụ ở đây là sự minh bạch — cả trong cách tiếp cận của Anthropic khi công bố toàn bộ system card và trong mục tiêu làm cho cơ sở hạ tầng phần mềm trở nên rõ ràng và an toàn hơn.

Tôi có thể sử dụng Claude Mythos Preview không?

Không, trừ khi bạn làm việc tại một trong hơn 40 tổ chức đối tác trong liên minh Dự án Glasswing. Anthropic chưa có kế hoạch công bố việc phát hành Mythos Preview rộng rãi.

Dự án Glasswing có liên quan đến Claude Opus 4.6 hay Claude Sonnet không?

Không. Mythos Preview là một mô hình riêng biệt, mạnh mẽ hơn. Claude Opus 4.6 và Sonnet 4.6 vẫn có sẵn thông qua API Anthropic và các sản phẩm tiêu dùng. Dự án Glasswing đặc biệt sử dụng Mythos Preview vì khả năng an ninh mạng vượt trội của nó.

Mythos Preview so với các mô hình khác trong các nhiệm vụ an ninh mạng như thế nào?

Không có mô hình nào khác được biết đến công khai đã thể hiện khả năng tự động phát hiện và khai thác các lỗ hổng zero-day ở quy mô này. System card mô tả các khả năng mà theo lời của Anthropic, đại diện cho một "bước nhảy vọt đáng kinh ngạc" so với tất cả các mô hình trước đó.

Điều này có nghĩa là AI sẽ thay thế các nhà nghiên cứu bảo mật là con người?

Không. Mô hình tạo ra các báo cáo lỗ hổng và các bản khai thác proof-of-concept, nhưng các kỹ sư bảo mật con người vẫn cần thiết để xác thực các phát hiện, phát triển bản vá, kiểm tra các bản sửa lỗi và phối hợp công bố. Hãy coi nó như một công cụ nhân sức mạnh giúp mở rộng đáng kể phạm vi mà một nhóm bảo mật có thể bao quát.

Còn rủi ro mô hình bị đánh cắp hoặc rò rỉ thì sao?

Đây là một mối lo ngại chính đáng mà Anthropic đã giải quyết trong system card. Mô hình triển khai hạn chế — nơi các tổ chức đối tác truy cập Mythos Preview thông qua cơ sở hạ tầng được kiểm soát thay vì tải xuống trọng số mô hình — được thiết kế để giảm thiểu rủi ro này.

Lời kết

Dự án Glasswing đại diện cho một bước ngoặt trong cách triển khai các khả năng AI tiên phong. Thay vì cách tiếp cận mặc định — phát hành rộng rãi và xử lý hậu quả sau — Anthropic đã chọn triển khai có mục tiêu cho một nhiệm vụ phòng thủ cụ thể.

Cho dù bạn coi đây là quản trị AI có trách nhiệm hay một tiền lệ nguy hiểm khi một công ty tư nhân đóng vai trò người gác cổng cho công nghệ mạnh mẽ, thì kết quả là điều khó có thể bàn cãi: hàng nghìn lỗ hổng nghiêm trọng trong các phần mềm quan trọng nhất thế giới đã được phát hiện và đưa vào quy trình vá lỗi trước khi những kẻ tấn công tìm thấy chúng.

Các tác động về an ninh mạng là tức thì. Các tác động về quản trị sẽ mất nhiều năm để thể hiện đầy đủ.

Tại Y Build, chúng tôi theo dõi ranh giới của các khả năng AI và cách chúng định hình lại việc phát triển phần mềm và bảo mật. Mặc dù Dự án Glasswing tập trung vào an ninh mạng, nhưng xu hướng cốt lõi — các mô hình AI trở nên đủ năng lực để yêu cầu triển khai hạn chế — sẽ định hình cách mọi nhà xây dựng làm việc với AI trong những năm tới.

Nguồn: