Project Glasswing: Anthropic의 AI 사이버 보안 프로그램 (2026)

Q: "Glasswing"의 의미는 무엇인가요?

이 이름은 날개가 거의 투명한 글래스윙 나비(*Greta oto*)에서 따왔습니다. 이는 Anthropic이 전체 시스템 카드를 공개하는 방식의 투명성과, 소프트웨어 인프라를 더 가시적이고 안전하게 만들고자 하는 목표를 상징합니다.

TL;DR

상세 항목	Project Glasswing
정의	Anthropic의 방어적 사이버 보안 이니셔티브
기반 모델	Claude Mythos Preview — Anthropic의 가장 강력한 모델
핵심 역량	제로데이 취약점을 자율적으로 발견하고 익스플로잇(exploit)함
범위	모든 주요 OS 및 브라우저에서 수천 개의 제로데이 발견
공개 여부	비공개 — 일반 대중에게 공개되지 않은 최초의 Anthropic 모델
파트너	AWS, Apple, Microsoft, Google, NVIDIA, Cisco, CrowdStrike, JPMorgan Chase, Broadcom, Palo Alto Networks, Linux Foundation
재정적 투입	1억 달러 상당의 사용 크레딧 + 400만 달러의 오픈 소스 보안 기부금
발표일	2026년 4월 7일

Project Glasswing이란 무엇인가?

Project Glasswing은 인간 팀이 감당할 수 없는 규모로 핵심 소프트웨어의 미발견 사이버 보안 취약점을 식별하고 수정하기 위해 AI를 사용하는 Anthropic의 이니셔티브입니다.

투명한 날개로 보안의 투명성을 상징하는 글래스윙 나비(glasswing butterfly)의 이름을 딴 이 프로젝트는 Anthropic이 일반 공개하기에는 너무 강력하다고 판단한 프런티어 모델인 Claude Mythos Preview를 기반으로 구축되었습니다.

전제는 간단합니다. 차세대 AI 모델이 보안 허점을 자율적으로 찾고 악용할 수 있다면, 공격자가 자체적인 툴을 만들기 전에 방어자들도 동일한 역량에 접근할 수 있어야 한다는 것입니다. Anthropic은 Mythos Preview를 전 세계에 출시하고 요행을 바라기보다, 전 세계가 의존하는 소프트웨어를 유지 관리하는 조직을 위한 방어 도구로 배포하기로 선택했습니다.

이로 인해 Project Glasswing은 AI 회사가 가장 진보된 모델에 대한 접근을 의도적으로 제한하고 그 역량을 특정 방어 임무에 집중시키는 최초의 프로그램이 되었습니다.

Project Glasswing이 존재하는 이유는?

내부 테스트 과정에서 Anthropic은 Claude Mythos Preview가 이전의 어떤 AI 모델도 보여주지 못한 성능, 즉 실제 운영 중인 소프트웨어에서 제로데이 취약점을 자율적으로 발견하고 익스플로잇하는 능력을 갖추었음을 발견했습니다.

2026년 4월 7일에 발행된 244페이지 분량의 시스템 카드(system card) 내용 중 일부입니다:

"Claude Mythos Preview는 주요 운영 체제 및 웹 브라우저에서 제로데이 취약점을 자율적으로 발견하고 익스플로잇하는 능력을 포함하여, 이전 모델들에 비해 사이버 역량 면에서 비약적인 도약을 보여주었습니다."

핵심 단어는 "자율적(autonomously)"입니다. 이전의 AI 모델은 전문가의 가이드가 있을 때 취약점 연구를 도울 수 있는 수준이었습니다. 반면 Mythos Preview는 소스 코드 읽기, 잠재적 결함에 대한 가설 수립, PoC(proof-of-concept) 익스플로잇 작성, 재현 단계가 포함된 완전한 버그 리포트 생성 등 전체 프로세스를 스스로 실행할 수 있습니다.

Anthropic은 자신들의 모델이 이 일을 할 수 있다면, 머지않아 다른 곳에서도 유사한 역량이 나타날 것이라고 판단했습니다. 문제는 "방어자들에게 먼저 기회를 줄 것인가, 아니면 그저 기다리며 희망을 가질 것인가?"였습니다.

그들은 선제적인 대응을 선택했습니다.

사이버 역량: Mythos Preview가 실제로 할 수 있는 일

Anthropic의 테스트 결과는 범위와 깊이 면에서 모두 놀랍습니다.

핵심 인프라 전반에서 발견된 수천 개의 제로데이

수 주에 걸친 기간 동안, Claude Mythos Preview는 다음과 같은 분야에서 수천 개의 이전에 알려지지 않은 취약점(대다수가 '심각(critical)' 등급)을 식별했습니다:

모든 주요 운영 체제 (Windows, macOS, Linux, FreeBSD, OpenBSD)
모든 주요 웹 브라우저 (Chrome, Firefox, Safari, Edge)
기타 핵심 소프트웨어 인프라 구성 요소

발견된 취약점의 99% 이상이 아직 패치되지 않았기 때문에, Anthropic은 단 몇 가지의 구체적인 사례만 공개했습니다.

공개된 특정 취약점 사례

패치가 완료되어 공개적으로 논의 가능한 버그들은 다음과 같습니다:

CVE-2026-4747 — FreeBSD에서 발견된 17년 된 원격 코드 실행(RCE) 취약점. 이 결함은 NFS 구현에 존재했으며, 인터넷상의 인증되지 않은 공격자가 루트 권한을 획득할 수 있게 했습니다. Mythos Preview는 이를 발견하고 작동하는 익스플로잇을 완전히 자율적으로 구축했습니다.

OpenBSD에서 발견된 27년 된 버그 — 보안을 정체성으로 삼는 시스템인 OpenBSD에서 발견되었다는 점이 주목할 만합니다. 이는 모델이 발견한 가장 오래된 취약점입니다.

FFmpeg의 H.264 코덱에서 발견된 16년 된 취약점 — 전 세계에서 가장 널리 배포된 멀티미디어 처리 라이브러리 중 하나에 영향을 미치는 결함입니다.

고급 익스플로잇 개발

Mythos Preview는 단순히 버그를 찾는 데 그치지 않습니다. 여러 버그를 엮어 정교한 공격 시퀀스를 만듭니다:

렌더러 샌드박스와 OS 샌드박스를 모두 탈출하는 JIT heap spray를 포함하여, 4개의 개별 취약점을 체이닝(chaining)한 웹 브라우저 익스플로잇을 작성한 사례가 있습니다.
미묘한 레이스 컨디션(race condition)과 KASLR bypass를 악용하여 Linux에서 로컬 권한 상승 익스플로잇을 자율적으로 개발했습니다.
개발자가 즉시 검토할 수 있는 전문적인 버그 리포트 형식으로, 재현 단계가 포함된 완전한 PoC 익스플로잇을 생성합니다.

기술적 작동 방식

Anthropic은 에이전트 기반 코딩 환경인 Claude Code를 통해 Mythos Preview를 구동합니다. 모델에게 보안 취약점을 찾으라는 프롬프트가 주어지면, 모델은 에이전트로서 다음을 수행합니다:

공격 표면(attack surface)을 이해하기 위해 소스 코드를 읽음
코드 패턴을 기반으로 잠재적 취약점에 대한 가설을 세움
가설을 확인하기 위해 테스트 하네스(test harness)와 익스플로잇 코드를 작성함
작동하는 PoC 익스플로잇이 포함된 구조화된 버그 리포트를 생성함

이 프로세스는 엔드투엔드로 자율화되어 있습니다. 인간이 개별 단계를 안내할 필요가 없습니다.

파트너사는 누구인가?

Project Glasswing은 12개의 창립 파트너로 시작하여 현재 40개 이상의 조직으로 확장되었습니다.

창립 파트너

조직	역할
Amazon Web Services	클라우드 인프라 제공업체
Apple	OS 및 브라우저 벤더
Broadcom	반도체 및 인프라 소프트웨어
Cisco	네트워킹 및 보안 인프라
CrowdStrike	엔드포인트 보안 플랫폼
Google	OS, 브라우저 및 클라우드 벤더
JPMorgan Chase	금융 인프라
Linux Foundation	오픈 소스 소프트웨어 생태계 관리자
Microsoft	OS, 브라우저 및 클라우드 벤더
NVIDIA	GPU 및 AI 인프라
Palo Alto Networks	네트워크 및 클라우드 보안

파트너 목록은 그 범위가 매우 넓다는 점에서 주목할 만합니다. 운영 체제 벤더(Apple, Microsoft, Google), 클라우드 제공업체(AWS, Google, Microsoft), 보안 기업(CrowdStrike, Palo Alto Networks), 금융 인프라(JPMorgan Chase), 그리고 오픈 소스 생태계(Linux Foundation)를 망라합니다.

오픈 소스 펀딩

Anthropic은 오픈 소스 보안 조직에 400만 달러의 직접 기부를 약속했습니다:

Linux Foundation을 통해 Alpha-Omega 및 OpenSSF에 250만 달러
Apache Software Foundation에 150만 달러

이것이 중요한 이유는 전 세계 핵심 소프트웨어 인프라의 상당수가 오픈 소스이며, 예산이 한정된 소규모 팀에 의해 유지 관리되고 있기 때문입니다. 이 자금은 해당 조직들이 Mythos Preview가 발견한 취약점에 신속히 대응하는 데 도움을 줍니다.

1억 달러의 약속

Anthropic은 Project Glasswing 전반에 걸쳐 Mythos Preview를 사용할 수 있도록 최대 1억 달러 규모의 사용 크레딧을 제공하고 있습니다.

이 숫자는 자율적 취약점 발견 작업이 얼마나 많은 컴퓨팅 자원을 소모하는지를 반영합니다. 모든 주요 소프트웨어 프로젝트의 수백만 줄의 코드를 대상으로 Mythos Preview를 실행하는 데는 막대한 비용이 듭니다. 파트너에게 비용을 청구하는 대신 크레딧을 제공함으로써, Anthropic은 방어 작업을 늦출 수 있는 비용 장벽을 제거했습니다.

참고로, 1억 달러의 크레딧은 공격자가 악용하기 전에 보안 결함을 찾고 문서화하는 데만 전념하는 수만 시간의 GPU 타임을 의미할 가능성이 높습니다.

왜 모델을 공개적으로 출시하지 않는가?

모두가 묻는 질문입니다. Anthropic의 논리는 세 가지 층위로 구성됩니다:

1. 이중 용도(Dual-use) 위험이 극도로 높음. Mythos Preview를 방어에 유용하게 만드는 바로 그 능력(자율적으로 제로데이를 찾고 익스플로잇하는 능력)은 공격에도 똑같이 유용할 것입니다. 이를 공개적으로 출시하면 전 세계 모든 공격자에게 인간 팀이 패치하는 속도보다 더 빠르게 취약점을 찾을 수 있는 도구를 쥐여주는 셈이 됩니다. 2. 비대칭성이 공격자에게 유리함. 공격자는 단 하나의 취약점만 찾으면 되지만, 방어자는 모든 취약점을 패치해야 합니다. 취약점 탐지 AI가 공개적으로 사용 가능하다면 방어자도 접근권이 있다 하더라도 이러한 비대칭성은 공격자에게 훨씬 더 유리하게 작용할 것입니다. 3. 통제된 배포가 효과적임. 핵심 인프라를 유지 관리하는 조직으로 접근을 제한함으로써, Anthropic은 모델의 결과물이 패치 파이프라인으로 직접 전달되도록 보장합니다. 취약점은 조율된 공개 프로세스를 통해 발견, 보고 및 수정되며, 익스플로잇 코드가 외부로 유출되지 않도록 관리됩니다.

이로 인해 Claude Mythos Preview는 일반 대중에게 공개되지 않은 최초의 Anthropic 모델이 되었습니다. 시스템 카드는 전체(244페이지) 공개되었지만, 모델 자체는 여전히 제한된 상태로 유지됩니다.

업계의 반응과 우려

Project Glasswing은 기술 및 정책 분야 전반에서 큰 관심을 끌고 있습니다.

긍정적인 반응

보안 연구원들과 업계 리더들은 대체로 이 이니셔티브를 칭찬하고 있습니다. Simon Willison은 설명된 역량을 고려할 때 Mythos를 보안 연구원들에게만 제한하는 것이 "필요해 보인다"고 언급했습니다. CNBC에 따르면, 연준 의장 파월, 재무장관 베센트, 그리고 미국 주요 은행 CEO들이 이 이니셔티브에 대해 논의했으며, 이는 AI 기반 취약점 발견의 시스템적 중요성을 반영합니다.

회의론과 우려

모두가 확신하는 것은 아닙니다. 일부 업계 베테랑들은 취약점을 찾는 것이 병목 현상이었던 적은 없었다고 주장합니다. 진짜 문제는 조직들이 실제로 패치를 적용하게 만드는 것입니다. Fortune이 보도했듯이, 발견과 해결 사이의 간극은 여전히 보안 체인의 가장 약한 고리로 남아 있습니다.

다른 이들은 특정 조직만이 강력한 역량에 접근할 수 있도록 AI 회사가 결정하는 선례에 대해 우려합니다. 영국의 AI 안전 연구소(AISI)는 Mythos Preview의 사이버 역량에 대한 자체 평가 보고서를 발표하여 해당 주장에 대한 독립적인 평가를 제공했습니다.

향후 전망

이것이 프런티어 AI의 새로운 표준이 될 것인가?

그럴 가능성이 높습니다. AI 모델의 능력이 향상됨에 따라, 극단적인 이중 용도 역량을 가진 모델에 대한 접근을 제한하는 관행은 표준이 될 것입니다. Project Glasswing은 이러한 방식의 템플릿을 제공합니다: 시스템 카드는 투명하게 공개하고, 모델 자체는 제한하며, 역량은 방어에 집중시키는 것입니다.

다른 AI 기업들도 뒤따를 것인가?

OpenAI는 이미 자체적인 사이버 보안 이니셔티브를 추진하고 있으며, Crypto News가 묘사했듯이 AI 기업들 간의 방어적 사이버 역량 "경쟁"이 벌어지고 있습니다.

취약점은 언제 공개되는가?

Anthropic은 표준적인 조율된 취약점 공개(CVD) 프로세스를 따르고 있습니다. 해당 벤더들이 패치를 출시함에 따라 해당 취약점의 상세 내용이 공개될 것입니다. 수천 개의 제로데이라는 방대한 양을 고려할 때, 이 프로세스는 수개월 혹은 그 이상 걸릴 것으로 보입니다.

자주 묻는 질문 (FAQ)

"Glasswing"의 의미는 무엇인가요?

이 이름은 날개가 거의 투명한 글래스윙 나비(Greta oto)에서 따왔습니다. 이는 Anthropic이 전체 시스템 카드를 공개하는 방식의 투명성과, 소프트웨어 인프라를 더 가시적이고 안전하게 만들고자 하는 목표를 상징합니다.

Claude Mythos Preview를 직접 사용할 수 있나요?

Project Glasswing 컨소시엄에 참여하는 40여 개 파트너 조직에서 근무하지 않는 한 불가능합니다. Anthropic은 Mythos Preview를 일반에 공개할 계획이 없다고 밝혔습니다.

Project Glasswing은 Claude Opus 4.6 또는 Claude Sonnet과 관련이 있나요?

아니요. Mythos Preview는 별도의 더 강력한 모델입니다. Claude Opus 4.6과 Sonnet 4.6은 Anthropic API와 소비자 제품을 통해 계속 사용할 수 있습니다. Project Glasswing은 뛰어난 사이버 보안 역량을 위해 특화된 Mythos Preview를 사용합니다.

Mythos Preview는 사이버 보안 작업에서 다른 모델들과 어떻게 비교되나요?

현재까지 알려진 다른 어떤 모델도 이 정도 규모로 제로데이 취약점을 자율적으로 발견하고 익스플로잇하는 능력을 보여준 적이 없습니다. 시스템 카드는 Anthropic의 표현을 빌리자면 이전의 모든 모델을 뛰어넘는 "비약적인 도약"을 보여주는 역량을 설명하고 있습니다.

이것이 AI가 인간 보안 연구원을 대체한다는 의미인가요?

아니요. 모델은 취약점 리포트와 PoC 익스플로잇을 생성하지만, 발견된 내용을 검증하고 패치를 개발하며 수정을 테스트하고 공개를 조율하는 데는 여전히 인간 보안 엔지니어가 필요합니다. 보안 팀이 커버할 수 있는 범위를 획기적으로 넓혀주는 '전력 증강 도구'라고 생각하면 됩니다.

모델이 도난당하거나 유출될 위험은 없나요?

이는 정당한 우려이며 Anthropic도 시스템 카드에서 이를 다루고 있습니다. 파트너 조직이 모델 가중치를 다운로드하는 대신 통제된 인프라를 통해 Mythos Preview에 접근하도록 하는 제한적 배포 모델은 이러한 위험을 최소화하도록 설계되었습니다.

요약

Project Glasswing은 프런티어 AI 역량이 배포되는 방식의 전환점을 시사합니다. "광범위하게 출시하고 나중에 문제를 처리하는" 기본 방식 대신, Anthropic은 특정 방어 임무를 위한 타겟팅된 배포를 선택했습니다.

이를 책임감 있는 AI 거버넌스로 보든, 혹은 민간 기업이 강력한 기술에 대해 관문 역할을 하는 위험한 선례로 보든, 결과 자체를 부정하기는 어렵습니다. 전 세계에서 가장 중요한 소프트웨어들의 수천 개에 달하는 심각한 취약점들이 공격자가 찾아내기 전에 발견되어 패치 파이프라인에 진입했다는 사실 말입니다.

사이버 보안에 미치는 영향은 즉각적입니다. 거버넌스에 미치는 영향은 완전히 파악되기까지 수년이 걸릴 것입니다.

Y Build는 AI 역량의 최전선과 그것이 소프트웨어 개발 및 보안을 어떻게 재편하는지 추적합니다. Project Glasswing은 사이버 보안에 집중하고 있지만, AI 모델이 제한된 배포를 요구할 만큼 강력해지는 근본적인 트렌드는 향후 모든 빌더들이 AI와 협력하는 방식을 규정하게 될 것입니다.

출처: