Dans deux semaines, Claude Opus 4.6 d'Anthropic identifié 22 failles de sécurité dans Firefox, dont 14 classées de haute gravité par Mozilla, ce qui représente près d'un cinquième de toutes les failles critiques corrigées dans le navigateur sur l'ensemble de l'année 2025. La majorité a été corrigée dans Firefox 148, les autres le seront dans les futures versions.

Quand l’IA est utilisée pour trouver des failles critiques
La collaboration est née d’un processus interne chez Anthropic. Fin 2025, l'équipe a constaté que Claude Opus 4.5 était proche d'un score parfait au CyberGym, un test permettant de reproduire des failles connues. Pour construire une évaluation plus exigeante, les chercheurs ont choisi Firefox : une base de code massive, comptant parmi les logiciels libres les plus sécurisés au monde, utilisée quotidiennement par des centaines de millions de personnes. Les vulnérabilités des navigateurs sont particulièrement dangereuses car les utilisateurs y chargent continuellement du contenu non fiable.
Claude a d'abord ciblé le moteur JavaScript de Firefox, surface d'attaque prioritaire car il exécute du code externe sur chaque page visitée. En 20 minutes d'exploration, le modèle a signalé un premier « Use After Free », une faille de mémoire permettant à un hacker de supprimer des données au contenu malveillant. Au moment où les chercheurs d'Anthropic ont validé et transmis ce premier rapport à Mozilla via Bugzilla, Claude avait déjà détecté 50 nouvelles entrées de crash supplémentaires.

Au total, Anthropic a analysé près de 6 000 fichiers C++ et soumis 112 rapports uniques. Mozilla a encouragé Anthropic à soumettre tous les résultats en masse, sans valider chaque cas individuellement, accélérant ainsi le processus de tri. Les chercheurs de Mozilla ont depuis commencé à expérimenter Claude en interne pour leur propre travail de sécurité.
Claude trouve les défauts, mais ne les exploite pas
Anthropic a également testé la capacité de Claude à transformer ces vulnérabilités en outils d'attaque réels. Résultat : malgré plusieurs centaines de tests représentant environ 4 000 $ de crédits via l'API, Claude Opus 4.6 n'a réussi à développer une vulnérabilité fonctionnelle que dans deux cas, et uniquement dans un environnement de test privé de certaines protections modernes comme le sandbox. Le modèle d’intelligence artificielle est donc nettement plus efficace pour détecter les vulnérabilités que pour les exploiter, ce qui confère aux défenseurs un avantage structurel.
Anthropic prévient cependant que cet avantage ne durera probablement pas : « Si les futurs modèles franchissent cette barrière opérationnelle, nous devrons envisager des mesures de protection supplémentaires. » La firme appelle les développeurs à profiter de cette fenêtre pour renforcer la sécurité de leurs logiciels et annonce un élargissement de ses efforts en matière de cybersécurité, notamment via Claude Code Security, actuellement en accès limité.






