Le 31 mars 2026, Anthropic a accidentellement publié l’intégralité du code source de Claude Code, son assistant de développement d’intelligence artificielle, via un fichier glissé dans la version 2.1.88 du package officiel npm. En quelques heures, 1 900 fichiers TypeScript représentant plus de 512 000 lignes de code ont été archivés sur GitHub, clonés plus de 41 500 fois avant qu’Anthropic ne réagisse.

C’est Chaofan Shou, chercheur en sécurité chez Solayer Labs, qui a déclenché l’alerte en publiant un lien direct aux archives sur X (anciennement Twitter). Le fichier de 59,8 Mo faisait référence à un référentiel hébergé sur le stockage cloud R2 d’Anthropic, accessible publiquement sans authentification. Anthropic a confirmé l’incident en déclarant : « Aucune donnée sensible ou identifiant client n’a été affecté ou exposé. Il s’agit d’un problème de version causé par une erreur humaine, et non par une faille de sécurité. Nous mettons actuellement en place des mesures pour éviter que cela ne se reproduise. ».
La fuite de Claude Code révèle des fonctions cachées
La vraie valeur de cette exposition ne réside pas dans la quantité de code, mais dans son contenu. Les développeurs qui ont analysé les fichiers ont identifié 44 fonctionnalités entièrement développées mais non activées dans la version publique, ainsi que plusieurs révélations embarrassantes pour Anthropic.
Parmi eux, le « Undercover Mode » : lorsque les collaborateurs d’Anthropic contribuent aux référentiels publics via Claude Code, ce mode est automatiquement activé pour effacer toute trace d’IA dans les messages de commit, sans possibilité de le désactiver manuellement. La communauté open source a immédiatement réagi, jugeant cette pratique trompeuse. Le code révèle également KAIROS, un système d’arrière-plan autonome pour la consolidation de la mémoire, non encore accessible au public, ainsi qu’un « Mode Coordinateur » permettant à Claude d’orchestrer plusieurs agents travaillant en parallèle. Le nom de code interne du projet Claude Code, Tengu, apparaît également dans les fichiers exposés.
Aucune donnée utilisateur n’a été compromise et les modèles de Claude (Opus et Sonnet) ne sont pas concernés par la fuite. Mais la fuite intervient dans un contexte déjà fragile : quelques jours plus tôt, il avait été révélé qu’Anthropic avait mis à disposition par erreur environ 3 000 fichiers internes, dont un projet d’article de blog décrivant un modèle en développement sous les noms de code « Mythos » et « Capybara », présenté en interne comme posant des risques de cybersécurité sans précédent. Ce sont deux fuites majeures en moins d’une semaine pour l’un des acteurs les plus en vue de l’IA générative.






