Projet Glasswing : Le programme de cybersécurité IA d'Anthropic (2026)

Q: Que signifie "Glasswing" ?

Le nom vient du papillon ailes de verre (*Greta oto*), dont les ailes sont presque transparentes. La métaphore est la transparence — tant dans l'approche d'Anthropic de publier la fiche système complète que dans l'objectif de rendre l'infrastructure logicielle plus visible et sécurisée.

TL;DR

Détail	Projet Glasswing
Quoi	Initiative de cybersécurité défensive d'Anthropic
Propulsé par	Claude Mythos Preview — le modèle le plus performant d'Anthropic
Capacité principale	Découvre et exploite de manière autonome des vulnérabilités zero-day
Portée	A trouvé des milliers de zero-days sur tous les principaux OS et navigateurs
Accès public	Aucun — premier modèle d'Anthropic jamais publié pour une disponibilité générale
Partenaires	AWS, Apple, Microsoft, Google, NVIDIA, Cisco, CrowdStrike, JPMorgan Chase, Broadcom, Palo Alto Networks, Linux Foundation
Engagement financier	100 M$ en crédits d'utilisation + 4 M$ de dons pour la sécurité open-source
Annoncé	7 avril 2026

Qu'est-ce que le Projet Glasswing ?

Le Projet Glasswing est une initiative d'Anthropic visant à utiliser l'IA pour identifier et corriger des vulnérabilités de cybersécurité non découvertes dans des logiciels critiques — à une échelle qu'aucune équipe humaine ne pourrait égaler.

Nommé d'après le papillon "ailes de verre" (connu pour ses ailes transparentes, symbolisant la transparence en matière de sécurité), le projet est basé sur Claude Mythos Preview, un modèle de pointe qu'Anthropic considère comme trop puissant pour une diffusion publique.

Le principe est simple : si les modèles d'IA de nouvelle génération peuvent trouver et exploiter des failles de sécurité de manière autonome, les défenseurs doivent avoir accès à ces mêmes capacités avant que les attaquants ne développent les leurs. Plutôt que de diffuser Mythos Preview dans le monde entier et d'espérer que tout se passe bien, Anthropic a choisi de le déployer comme un outil défensif pour les organisations qui maintiennent les logiciels dont dépend le monde.

Cela fait du Projet Glasswing un programme unique en son genre — une entreprise d'IA restreignant délibérément l'accès à son modèle le plus avancé pour canaliser ses capacités vers une mission défensive spécifique.

Pourquoi le Projet Glasswing existe-t-il ?

Lors de tests internes, Anthropic a découvert que Claude Mythos Preview pouvait faire quelque chose qu'aucun modèle d'IA précédent n'avait démontré : découvrir et exploiter de manière autonome des vulnérabilités zero-day dans des logiciels de production réels.

Extrait de la fiche système (system card) de 244 pages publiée le 7 avril 2026 :

"Claude Mythos Preview a démontré un saut impressionnant dans les capacités cyber par rapport aux modèles précédents, notamment la capacité de découvrir et d'exploiter de manière autonome des vulnérabilités zero-day dans les principaux systèmes d'exploitation et navigateurs web."

Le mot clé est "autonome". Les modèles d'IA précédents pouvaient aider à la recherche de vulnérabilités lorsqu'ils étaient guidés par des experts. Mythos Preview peut gérer l'ensemble du processus seul : lire le code source, formuler des hypothèses sur les failles potentielles, écrire des exploits de preuve de concept (PoC) et produire des rapports de bug complets avec les étapes de reproduction.

Anthropic a réalisé que si leur modèle pouvait faire cela, ce n'était qu'une question de temps avant que des capacités similaires n'apparaissent ailleurs. La question est devenue : donnons-nous une longueur d'avance aux défenseurs, ou attendons-nous en espérant le meilleur ?

Ils ont choisi la longueur d'avance.

Capacités cyber : ce que Mythos Preview peut réellement faire

Les résultats des tests d'Anthropic sont remarquables, tant par leur étendue que par leur profondeur.

Des milliers de Zero-Days à travers les infrastructures critiques

Sur une période de quelques semaines, Claude Mythos Preview a identifié des milliers de vulnérabilités auparavant inconnues — dont beaucoup ont été classées comme critiques — dans :

Tous les principaux systèmes d'exploitation (Windows, macOS, Linux, FreeBSD, OpenBSD)
Tous les principaux navigateurs web (Chrome, Firefox, Safari, Edge)
D'autres composants critiques de l'infrastructure logicielle

Plus de 99 % des vulnérabilités découvertes n'ont pas encore été corrigées, c'est pourquoi Anthropic n'a divulgué qu'une poignée d'exemples spécifiques.

Vulnérabilités spécifiques divulguées

Parmi les bugs qui ont été corrigés et qui peuvent être discutés publiquement :

CVE-2026-4747 — Une vulnérabilité d'exécution de code à distance vieille de 17 ans dans FreeBSD. La faille existait dans l'implémentation NFS et permettait à un attaquant non authentifié, n'importe où sur Internet, d'obtenir un accès root. Mythos Preview l'a trouvée et a construit un exploit fonctionnel de manière totalement autonome.

Un bug vieux de 27 ans dans OpenBSD — notable car OpenBSD est un système dont l'identité entière est construite autour de la sécurité. C'est la plus ancienne vulnérabilité découverte par le modèle.

Une vulnérabilité vieille de 16 ans dans le codec H.264 de FFmpeg — affectant l'une des bibliothèques de traitement multimédia les plus largement déployées au monde.

Développement d'exploits avancés

Mythos Preview ne se contente pas de trouver des bugs. Il les enchaîne dans des séquences d'attaque sophistiquées :

Dans un cas, il a écrit un exploit de navigateur web enchaînant quatre vulnérabilités distinctes, incluant un JIT heap spray qui s'est échappé à la fois du bac à sable (sandbox) du moteur de rendu et de celui de l'OS.
Il a développé de manière autonome des exploits d'escalade de privilèges locale sur Linux en exploitant des conditions de concurrence (race conditions) subtiles et des contournements de KASLR.
Il génère des exploits de preuve de concept complets avec les étapes de reproduction, formatés comme des rapports de bug professionnels prêts pour le tri par les développeurs.

Fonctionnement technique

Anthropic exécute Mythos Preview via Claude Code — son environnement de codage agentique. Le modèle reçoit pour instruction de trouver des vulnérabilités de sécurité, puis, de manière agentique :

Lit le code source pour comprendre la surface d'attaque
Formule des hypothèses sur les vulnérabilités potentielles basées sur les modèles de code
Écrit des harnais de test et du code d'exploitation pour confirmer ses hypothèses
Produit des rapports de bug structurés avec des exploits de preuve de concept fonctionnels

Le processus est autonome de bout en bout. Aucun humain n'a besoin de le guider à travers les étapes individuelles.

Qui sont les partenaires ?

Le Projet Glasswing a été lancé avec 12 partenaires fondateurs et s'est depuis étendu à plus de 40 organisations.

Partenaires fondateurs

Organisation	Rôle
Amazon Web Services	Fournisseur d'infrastructure cloud
Apple	Éditeur d'OS et de navigateur
Broadcom	Semi-conducteurs et logiciels d'infrastructure
Cisco	Infrastructure de réseau et de sécurité
CrowdStrike	Plateforme de sécurité des terminaux
Google	Éditeur d'OS, de navigateur et fournisseur cloud
JPMorgan Chase	Infrastructure financière
Linux Foundation	Gestionnaire de l'écosystème logiciel open-source
Microsoft	Éditeur d'OS, de navigateur et fournisseur cloud
NVIDIA	Infrastructure GPU et IA
Palo Alto Networks	Sécurité réseau et cloud

La liste des partenaires est notable par sa diversité. Elle couvre les éditeurs de systèmes d'exploitation (Apple, Microsoft, Google), les fournisseurs de cloud (AWS, Google, Microsoft), les entreprises de sécurité (CrowdStrike, Palo Alto Networks), l'infrastructure financière (JPMorgan Chase) et l'écosystème open-source (Linux Foundation).

Financement de l'Open-Source

Anthropic a engagé 4 M$ en dons directs à des organisations de sécurité open-source :

2,5 M$ à Alpha-Omega et OpenSSF via la Linux Foundation
1,5 M$ à l'Apache Software Foundation

Cela est crucial car une grande partie de l'infrastructure logicielle critique mondiale est open-source, maintenue par de petites équipes disposant de budgets de sécurité limités. Le financement aide ces organisations à agir sur les vulnérabilités trouvées par Mythos Preview.

L'engagement de 100 M$

Anthropic engage jusqu'à 100 millions de dollars en crédits d'utilisation pour Mythos Preview dans le cadre du Projet Glasswing.

Ce chiffre reflète la nature intensive en calcul de la découverte autonome de vulnérabilités. L'exécution de Mythos Preview sur des millions de lignes de code dans chaque projet logiciel majeur est coûteuse. En fournissant des crédits plutôt qu'en facturant les partenaires, Anthropic lève la barrière financière qui ralentirait autrement le travail défensif.

Pour donner un ordre d'idée, 100 M$ en crédits représentent probablement des dizaines de milliers d'heures-GPU dédiées purement à la recherche et à la documentation de failles de sécurité avant que des attaquants ne puissent les exploiter.

Pourquoi ne pas rendre le modèle public ?

C'est la question que tout le monde se pose. Le raisonnement d'Anthropic comporte trois niveaux :

1. Le risque de double usage est extrême. La capacité exacte qui rend Mythos Preview précieux pour la défense — trouver et exploiter de manière autonome des zero-days — le rendrait tout aussi précieux pour l'attaque. Le publier permettrait à chaque attaquant dans le monde d'accéder à un outil capable de trouver des failles exploitables plus rapidement que n'importe quelle équipe humaine ne peut les corriger. 2. L'asymétrie favorise les attaquants. Les attaquants n'ont besoin de trouver qu'une seule vulnérabilité. Les défenseurs doivent toutes les corriger. Une IA de recherche de vulnérabilités accessible au public accentuerait cette asymétrie en faveur des attaquants, même si les défenseurs y avaient également accès. 3. Le déploiement contrôlé fonctionne. En limitant l'accès aux organisations qui maintiennent les infrastructures critiques, Anthropic s'assure que les résultats du modèle alimentent directement le pipeline de correctifs. Les vulnérabilités sont trouvées, signalées par une divulgation coordonnée et corrigées — sans que le code d'exploitation ne fuite dans la nature.

Cela fait de Claude Mythos Preview le premier modèle d'Anthropic à ne jamais être publié pour une disponibilité générale. La fiche système a été publiée intégralement (les 244 pages), mais le modèle lui-même reste restreint.

Réactions et préoccupations de l'industrie

Le Projet Glasswing a attiré une attention considérable dans le paysage technologique et politique.

Réception positive

Les chercheurs en sécurité et les leaders de l'industrie ont largement salué l'initiative. Simon Willison a noté que restreindre Mythos aux chercheurs en sécurité "semble nécessaire" compte tenu des capacités décrites. L'initiative a été discutée entre le président de la Réserve fédérale Powell, le secrétaire au Trésor Bessent et les PDG des grandes banques américaines, selon CNBC, reflétant l'importance systémique de la découverte de vulnérabilités pilotée par l'IA.

Scepticisme et préoccupations

Tout le monde n'est pas convaincu. Certains vétérans de l'industrie soutiennent que trouver des vulnérabilités n'a jamais été le goulot d'étranglement — le vrai problème est d'amener les organisations à les corriger réellement. Comme l'a rapporté Fortune, l'écart entre la découverte et la remédiation reste le maillon le plus faible de la chaîne de sécurité.

D'autres s'inquiètent du précédent créé par une entreprise d'IA décidant quelles organisations ont accès à des capacités puissantes et lesquelles n'y ont pas accès. L'AI Safety Institute (AISI) du Royaume-Uni a publié sa propre évaluation des capacités cyber de Mythos Preview, fournissant une évaluation indépendante des affirmations.

Et après ?

Est-ce la nouvelle norme pour l'IA de pointe ?

Probablement, oui. À mesure que les modèles d'IA deviennent plus performants, la pratique consistant à restreindre l'accès aux modèles ayant des capacités extrêmes de double usage deviendra probablement la norme. Le Projet Glasswing est un modèle de la manière dont cela peut fonctionner : publier la fiche système de manière transparente, restreindre le modèle lui-même, canaliser les capacités vers la défense.

Les autres entreprises d'IA suivront-elles ?

OpenAI poursuit déjà ses propres initiatives de cybersécurité, créant ce que Crypto News a décrit comme une "course" entre les entreprises d'IA sur les capacités cyber défensives.

Quand les vulnérabilités seront-elles divulguées ?

Anthropic suit les processus standard de divulgation coordonnée de vulnérabilités. À mesure que les correctifs sont publiés par les fournisseurs concernés, les détails des vulnérabilités correspondantes deviendront publics. Étant donné le volume — des milliers de zero-days — ce processus prendra des mois, voire plus.

Foire aux questions (FAQ)

Que signifie "Glasswing" ?

Le nom vient du papillon ailes de verre (Greta oto), dont les ailes sont presque transparentes. La métaphore est la transparence — tant dans l'approche d'Anthropic de publier la fiche système complète que dans l'objectif de rendre l'infrastructure logicielle plus visible et sécurisée.

Puis-je utiliser Claude Mythos Preview ?

Non, à moins que vous ne travailliez dans l'une des 40+ organisations partenaires du consortium Project Glasswing. Anthropic n'a annoncé aucun projet de publication de Mythos Preview pour une disponibilité générale.

Le Projet Glasswing est-il lié à Claude Opus 4.6 ou Claude Sonnet ?

Non. Mythos Preview est un modèle distinct et plus performant. Claude Opus 4.6 et Sonnet 4.6 restent disponibles via l'API Anthropic et les produits grand public. Le Projet Glasswing utilise spécifiquement Mythos Preview pour ses capacités supérieures en cybersécurité.

Comment Mythos Preview se compare-t-il aux autres modèles sur les tâches de cybersécurité ?

Aucun autre modèle connu publiquement n'a démontré la capacité de découvrir et d'exploiter de manière autonome des vulnérabilités zero-day à cette échelle. La fiche système décrit des capacités qui représentent, selon les termes d'Anthropic, un "saut impressionnant" par rapport à tous les modèles précédents.

Cela signifie-t-il que l'IA remplacera les chercheurs en sécurité humains ?

Non. Le modèle produit des rapports de vulnérabilité et des exploits de preuve de concept, mais les ingénieurs en sécurité humains sont toujours nécessaires pour valider les découvertes, développer des correctifs, tester les solutions et coordonner la divulgation. Considérez cela comme un multiplicateur de force qui élargit considérablement la portée de ce qu'une équipe de sécurité peut couvrir.

Qu'en est-il du risque que le modèle soit volé ou fuité ?

C'est une préoccupation légitime qu'Anthropic a abordée dans la fiche système. Le modèle de déploiement restreint — où les organisations partenaires accèdent à Mythos Preview via une infrastructure contrôlée plutôt qu'en téléchargeant les poids du modèle — est conçu pour minimiser ce risque.

L'essentiel

Le Projet Glasswing représente un tournant dans la manière dont les capacités d'IA de pointe sont déployées. Au lieu de l'approche par défaut — publier largement et gérer les conséquences plus tard — Anthropic a choisi un déploiement ciblé pour une mission défensive spécifique.

Que vous considériez cela comme une gouvernance responsable de l'IA ou comme un précédent dangereux où une entreprise privée contrôle l'accès à une technologie puissante, les résultats sont difficiles à contester : des milliers de vulnérabilités critiques dans les logiciels les plus importants du monde, découvertes et entrant dans le pipeline de correctifs avant que des attaquants ne les trouvent.

Les implications pour la cybersécurité sont immédiates. Les implications pour la gouvernance mettront des années à se manifester pleinement.

Chez Y Build, nous suivons la frontière des capacités de l'IA et la manière dont elles remodèlent le développement logiciel et la sécurité. Alors que le Projet Glasswing se concentre sur la cybersécurité, la tendance sous-jacente — des modèles d'IA devenant assez performants pour nécessiter un déploiement restreint — façonnera la manière dont chaque créateur travaillera avec l'IA dans les années à venir.

Sources :