Projeto Glasswing: O Programa de Cibersegurança de IA da Anthropic (2026)

Q: O que significa "Glasswing"?

O nome vem da borboleta glasswing (*Greta oto*), cujas asas são quase transparentes. A metáfora é a transparência — tanto na abordagem da Anthropic de publicar o system card completo quanto no objetivo de tornar a infraestrutura de software mais visível e segura.

TL;DR

Detalhe	Projeto Glasswing
O que é	Iniciativa de cibersegurança defensiva da Anthropic
Alimentado por	Claude Mythos Preview — o modelo mais capaz da Anthropic
Capacidade principal	Descobre e explora vulnerabilidades de dia zero de forma autônoma
Escopo	Encontrou milhares de dias zero em todos os principais sistemas operacionais e navegadores
Acesso público	Nenhum — primeiro modelo da Anthropic nunca lançado para disponibilidade geral
Parceiros	AWS, Apple, Microsoft, Google, NVIDIA, Cisco, CrowdStrike, JPMorgan Chase, Broadcom, Palo Alto Networks, Linux Foundation
Compromisso financeiro	US$ 100 milhões em créditos de uso + US$ 4 milhões em doações para segurança de código aberto
Anunciado	7 de abril de 2026

O que é o Projeto Glasswing?

O Projeto Glasswing é uma iniciativa da Anthropic para usar IA na identificação e correção de vulnerabilidades de cibersegurança não descobertas em softwares críticos — em uma escala que nenhuma equipe humana poderia alcançar.

Nomeado em homenagem à borboleta glasswing (conhecida por suas asas transparentes, simbolizando a transparência na segurança), o projeto é construído sobre o Claude Mythos Preview, um modelo de fronteira que a Anthropic considera poderoso demais para o lançamento público.

A premissa é direta: se os modelos de IA de próxima geração podem encontrar e explorar falhas de segurança de forma autônoma, os defensores precisam ter acesso a essas mesmas capacidades antes que os atacantes construam as suas próprias. Em vez de lançar o Mythos Preview para o mundo e esperar pelo melhor, a Anthropic optou por implantá-lo como uma ferramenta defensiva para organizações que mantêm o software do qual o mundo depende.

Isso torna o Projeto Glasswing um programa pioneiro — uma empresa de IA restringindo deliberadamente o acesso ao seu modelo mais avançado e canalizando suas capacidades para uma missão defensiva específica.

Por que o Projeto Glasswing existe?

Durante testes internos, a Anthropic descobriu que o Claude Mythos Preview conseguia fazer algo que nenhum modelo de IA anterior havia demonstrado: descobrir e explorar autonomamente vulnerabilidades de dia zero em softwares de produção do mundo real.

Do system card de 244 páginas publicado em 7 de abril de 2026:

"O Claude Mythos Preview demonstrou um salto impressionante em capacidades cibernéticas em relação aos modelos anteriores, incluindo a habilidade de descobrir e explorar autonomamente vulnerabilidades de dia zero em grandes sistemas operacionais e navegadores web."

A palavra-chave é "autonomamente". Modelos de IA anteriores podiam auxiliar na pesquisa de vulnerabilidades quando guiados por especialistas. O Mythos Preview pode executar todo o processo sozinho — lendo o código-fonte, formulando hipóteses sobre falhas potenciais, escrevendo exploits de prova de conceito (PoC) e produzindo relatórios de bugs completos com etapas de reprodução.

A Anthropic percebeu que, se o seu modelo conseguia fazer isso, era apenas uma questão de tempo até que capacidades semelhantes aparecessem em outros lugares. A questão tornou-se: damos aos defensores uma vantagem inicial ou esperamos e torcemos?

Eles escolheram a vantagem inicial.

As capacidades cibernéticas: O que o Mythos Preview realmente pode fazer

Os resultados dos testes da Anthropic são notáveis tanto em amplitude quanto em profundidade.

Milhares de Dias Zero em Infraestrutura Crítica

Ao longo de um período de semanas, o Claude Mythos Preview identificou milhares de vulnerabilidades anteriormente desconhecidas — muitas classificadas como críticas — em:

Todos os principais sistemas operacionais (Windows, macOS, Linux, FreeBSD, OpenBSD)
Todos os principais navegadores web (Chrome, Firefox, Safari, Edge)
Outros componentes críticos de infraestrutura de software

Mais de 99% das vulnerabilidades descobertas ainda não foram corrigidas, razão pela qual a Anthropic divulgou apenas alguns exemplos específicos.

Vulnerabilidades Específicas Divulgadas

Entre os bugs que foram corrigidos e podem ser discutidos publicamente:

CVE-2026-4747 — Uma vulnerabilidade de execução remota de código de 17 anos no FreeBSD. A falha existia na implementação do NFS e permitia que um atacante não autenticado de qualquer lugar da internet obtivesse acesso root. O Mythos Preview a encontrou e construiu um exploit funcional de forma totalmente autônoma.

Um bug de 27 anos no OpenBSD — notável porque o OpenBSD é um sistema cuja identidade inteira é construída em torno da segurança. Esta é a vulnerabilidade mais antiga que o modelo descobriu.

Uma vulnerabilidade de 16 anos no codec H.264 do FFmpeg — afetando uma das bibliotecas de processamento multimídia mais amplamente implantadas no mundo.

Desenvolvimento de Exploits Avançados

O Mythos Preview não apenas encontra bugs. Ele os encadeia em sequências de ataque sofisticadas:

Em um caso, ele escreveu um exploit de navegador web encadeando quatro vulnerabilidades distintas, incluindo um JIT heap spray que escapou tanto da sandbox do renderizador quanto da sandbox do sistema operacional.
Desenvolveu autonomamente exploits de escalonamento de privilégio local no Linux, explorando condições de corrida (race conditions) sutis e bypasses de KASLR.
Gera exploits de prova de conceito completos com etapas de reprodução, formatados como relatórios de bugs profissionais prontos para triagem de desenvolvedores.

Como funciona tecnicamente

A Anthropic executa o Mythos Preview através do Claude Code — seu ambiente de codificação agentivo. O modelo é instruído a encontrar vulnerabilidades de segurança e, em seguida, de forma agentiva:

Lê o código-fonte para entender a superfície de ataque
Cria hipóteses sobre vulnerabilidades potenciais baseadas em padrões de código
Escreve test harnesses e código de exploit para confirmar suas hipóteses
Produz relatórios de bugs estruturados com exploits de prova de conceito funcionais

O processo é autônomo de ponta a ponta. Nenhum humano precisa guiá-lo através de etapas individuais.

Quem são os parceiros?

O Projeto Glasswing foi lançado com 12 parceiros fundadores e, desde então, expandiu-se para mais de 40 organizações.

Parceiros Fundadores

Organização	Papel
Amazon Web Services	Provedor de infraestrutura de nuvem
Apple	Fornecedor de SO e navegador
Broadcom	Semicondutores e software de infraestrutura
Cisco	Infraestrutura de rede e segurança
CrowdStrike	Plataforma de segurança de endpoint
Google	Fornecedor de SO, navegador e nuvem
JPMorgan Chase	Infraestrutura financeira
Linux Foundation	Curador do ecossistema de software de código aberto
Microsoft	Fornecedor de SO, navegador e nuvem
NVIDIA	Infraestrutura de GPU e IA
Palo Alto Networks	Segurança de rede e nuvem

A lista de parceiros é notável por sua abrangência. Ela inclui fornecedores de sistemas operacionais (Apple, Microsoft, Google), provedores de nuvem (AWS, Google, Microsoft), empresas de segurança (CrowdStrike, Palo Alto Networks), infraestrutura financeira (JPMorgan Chase) e o ecossistema de código aberto (Linux Foundation).

Financiamento de Código Aberto

A Anthropic comprometeu US$ 4 milhões em doações diretas para organizações de segurança de código aberto:

US$ 2,5 milhões para Alpha-Omega e OpenSSF através da Linux Foundation
US$ 1,5 milhão para a Apache Software Foundation

Isso é importante porque grande parte da infraestrutura de software crítica do mundo é de código aberto, mantida por pequenas equipes com orçamentos de segurança limitados. O financiamento ajuda essas organizações a agir sobre as vulnerabilidades que o Mythos Preview encontrar.

O Compromisso de US$ 100 Milhões

A Anthropic está comprometendo até US$ 100 milhões em créditos de uso para o Mythos Preview no âmbito do Projeto Glasswing.

Esse número reflete a natureza intensiva em computação da descoberta autônoma de vulnerabilidades. Executar o Mythos Preview em milhões de linhas de código em todos os principais projetos de software é caro. Ao fornecer créditos em vez de cobrar dos parceiros, a Anthropic remove a barreira de custo que, de outra forma, retardaria o trabalho defensivo.

Para contextualizar, US$ 100 milhões em créditos provavelmente representam dezenas de milhares de horas de GPU dedicadas puramente a encontrar e documentar falhas de segurança antes que os atacantes possam explorá-las.

Por que não lançar o modelo publicamente?

Esta é a pergunta que todos fazem. O raciocínio da Anthropic tem três camadas:

1. O risco de uso duplo é extremo. A mesma capacidade que torna o Mythos Preview valioso para a defesa — encontrar e explorar dias zero autonomamente — o tornaria igualmente valioso para o ataque. Lançá-lo publicamente daria a cada atacante no mundo acesso a uma ferramenta que pode encontrar vulnerabilidades exploráveis mais rápido do que qualquer equipe humana pode corrigi-las. 2. A assimetria favorece os atacantes. Atacantes precisam encontrar uma vulnerabilidade. Defensores precisam corrigir todas elas. Uma IA de descoberta de vulnerabilidades disponível publicamente inclinaria essa assimetria ainda mais para os atacantes, mesmo que os defensores também tivessem acesso. 3. A implantação controlada funciona. Ao limitar o acesso às organizações que mantêm infraestrutura crítica, a Anthropic garante que a saída do modelo vá diretamente para o pipeline de correção. As vulnerabilidades são encontradas, relatadas por meio de divulgação coordenada e corrigidas — sem que o código do exploit vaze publicamente.

Isso faz do Claude Mythos Preview o primeiro modelo da Anthropic nunca lançado para disponibilidade geral. O system card foi publicado na íntegra (todas as 244 páginas), mas o modelo em si permanece restrito.

Reações da Indústria e Preocupações

O Projeto Glasswing atraiu atenção significativa em todo o cenário de tecnologia e políticas públicas.

Recepção Positiva

Pesquisadores de segurança e líderes da indústria elogiaram amplamente a iniciativa. Simon Willison observou que restringir o Mythos a pesquisadores de segurança "parece necessário" dadas as capacidades descritas. A iniciativa foi discutida entre o presidente do Federal Reserve, Powell, o secretário do Tesouro, Bessent, e CEOs dos principais bancos dos EUA, de acordo com a CNBC, refletindo a importância sistêmica da descoberta de vulnerabilidades impulsionada por IA.

Ceticismo e Preocupações

Nem todos estão convencidos. Alguns veteranos da indústria argumentam que encontrar vulnerabilidades nunca foi o gargalo — o problema real é fazer com que as organizações realmente as corrijam. Como relatou a Fortune, a lacuna entre a descoberta e a remediação continua sendo o elo mais fraco na cadeia de segurança.

Outros se preocupam com o precedente de uma empresa de IA decidir quais organizações têm acesso a capacidades poderosas e quais não têm. O AI Safety Institute (AISI) do Reino Unido publicou sua própria avaliação das capacidades cibernéticas do Mythos Preview, fornecendo uma análise independente das afirmações.

O que acontece agora?

Este é o novo normal para a IA de fronteira?

Provavelmente sim. À medida que os modelos de IA se tornam mais capazes, a prática de restringir o acesso a modelos com capacidades extremas de uso duplo provavelmente se tornará padrão. O Projeto Glasswing é um modelo de como isso pode funcionar: publicar o system card de forma transparente, restringir o modelo em si e canalizar as capacidades para a defesa.

Outras empresas de IA seguirão o exemplo?

A OpenAI já está buscando suas próprias iniciativas de cibersegurança, criando o que a Crypto News descreveu como uma "corrida" entre empresas de IA em capacidades cibernéticas defensivas.

Quando as vulnerabilidades serão divulgadas?

A Anthropic está seguindo processos padrão de divulgação coordenada de vulnerabilidades. À medida que os patches são lançados pelos fornecedores afetados, os detalhes correspondentes da vulnerabilidade se tornarão públicos. Dado o volume — milhares de dias zero — esse processo levará meses ou mais.

Perguntas Frequentes

O que significa "Glasswing"?

O nome vem da borboleta glasswing (Greta oto), cujas asas são quase transparentes. A metáfora é a transparência — tanto na abordagem da Anthropic de publicar o system card completo quanto no objetivo de tornar a infraestrutura de software mais visível e segura.

Posso usar o Claude Mythos Preview?

Não, a menos que você trabalhe em uma das mais de 40 organizações parceiras no consórcio do Projeto Glasswing. A Anthropic não anunciou planos para lançar o Mythos Preview para disponibilidade geral.

O Projeto Glasswing está relacionado ao Claude Opus 4.6 ou Claude Sonnet?

Não. O Mythos Preview é um modelo separado e mais capaz. O Claude Opus 4.6 e o Sonnet 4.6 permanecem disponíveis através da API da Anthropic e produtos de consumo. O Projeto Glasswing utiliza especificamente o Mythos Preview por suas capacidades superiores de cibersegurança.

Como o Mythos Preview se compara a outros modelos em tarefas de cibersegurança?

Nenhum outro modelo publicamente conhecido demonstrou a capacidade de descobrir e explorar autonomamente vulnerabilidades de dia zero nesta escala. O system card descreve capacidades que representam, nas palavras da Anthropic, um "salto impressionante" além de todos os modelos anteriores.

Isso significa que a IA substituirá os pesquisadores de segurança humanos?

Não. O modelo produz relatórios de vulnerabilidades e exploits de prova de conceito, mas engenheiros de segurança humanos ainda são necessários para validar as descobertas, desenvolver patches, testar correções e coordenar a divulgação. Pense nisso como um multiplicador de força que expande dramaticamente o escopo do que uma equipe de segurança pode cobrir.

E quanto ao risco de o modelo ser roubado ou vazado?

Esta é uma preocupação legítima que a Anthropic abordou no system card. O modelo de implantação restrita — onde as organizações parceiras acessam o Mythos Preview através de infraestrutura controlada em vez de baixar os pesos do modelo — é projetado para minimizar esse risco.

Conclusão

O Projeto Glasswing representa um ponto de virada na forma como as capacidades de IA de fronteira são implantadas. Em vez da abordagem padrão — lançar amplamente e lidar com as consequências depois — a Anthropic escolheu a implantação direcionada para uma missão defensiva específica.

Se você vê isso como governança de IA responsável ou um precedente perigoso onde uma empresa privada controla o acesso a uma tecnologia poderosa, os resultados são difíceis de contestar: milhares de vulnerabilidades críticas nos softwares mais importantes do mundo, descobertas e entrando no pipeline de correção antes que os atacantes as encontrassem.

As implicações para a cibersegurança são imediatas. As implicações de governança levarão anos para se desenrolar completamente.

Na Y Build, acompanhamos a fronteira das capacidades de IA e como elas remodelam o desenvolvimento e a segurança de software. Embora o Projeto Glasswing se concentre na cibersegurança, a tendência subjacente — modelos de IA tornando-se capazes o suficiente para exigir implantação restrita — moldará como cada desenvolvedor trabalhará com IA nos próximos anos.

Fontes: