Le 20 octobre 2025, une panne majeure chez Amazon Web Services (AWS) a paralysé de nombreux services sur Internet. Un rapport détaillé mis en ligne par Amazon révélé qu'un bug de son logiciel d'automatisation DynamoDB était à l'origine de cet incident qui donnait l'impression qu'une partie d'Internet était hors service.

Un bug dans DynamoDB a déclenché un échec DNS en chaîne
La panne a commencé à cause d'un bug dans DynamoDB, le système sur lequel les clients AWS stockent leurs données. Ce logiciel, qui gère des centaines de milliers d'enregistrements DNS, a soudainement généré une entrée DNS vide pour les centres de données d'Amazon en Virginie du Nord. Même si Amazon propose des serveurs partout dans le monde, la panne dans sa région US-EAST-1 n'a pas affecté uniquement les États-Unis. Cela a eu un impact au niveau mondial.
Normalement, le système est conçu pour résoudre automatiquement ces problèmes. Cependant, cette fois, le mécanisme de réparation a échoué. Cette panne a contraint les équipes d'Amazon à intervenir manuellement pour résoudre l'incident. Pendant ce temps, tous les systèmes qui dépendaient de DynamoDB pour fonctionner ne pouvaient plus s'y connecter, connaissant à leur tour des pannes DNS.
De nombreux services étaient en panne
L’impact de cette panne s’est rapidement propagé à un grand nombre d’applications et de sites Internet. Parmi les services concernés figuraient des plateformes majeures comme Snapchat, Reddit, Disney+, Fortnite et même le PlayStation Network. Amazon lui-même ainsi que ses appareils Alexa ont été concernés.
Pour les utilisateurs, les conséquences allaient du simple ralentissement à l’inaccessibilité totale des services. En réponse à l'incident, Amazon a présenté ses excuses :
Nous nous excusons auprès de nos clients pour la gêne occasionnée par cet incident. Bien que nous ayons toujours fourni des services avec une disponibilité optimale, nous comprenons l'importance cruciale de nos services pour nos clients, leurs applications, leurs utilisateurs finaux et leurs entreprises. Nous savons que cet incident a eu des implications importantes pour de nombreux clients. Nous ferons tout notre possible pour tirer les leçons de cet incident et l'utiliser pour améliorer encore notre disponibilité.






