Panne mondiale AWS: Internet se rétablit progressivement et met en lumière la dépendance au cloud

Contexte et portée de l’incident

Une panne majeure affectant Amazon Web Services (AWS) a entravé l’accès à un segment important d’Internet lundi matin, touchant des sites, des jeux en ligne et diverses applications. Cet événement met en relief la dépendance croissante des entreprises vis-à-vis des grands acteurs américains du cloud.

Applications et services affectés

Plusieurs services et plateformes largement utilisés, tels que Snapchat et Fortnite, ainsi que des sites de réservation et des communautés en ligne comme Airbnb, Reddit, Roblox et Brawl Stars, ont connu des interruptions durant plusieurs heures. Des répercussions ont aussi été signalées au Royaume‑Uni sur des services bancaires, et Coinbase a indiqué des difficultés liées à la panne AWS.

Sur X, des messages évoquaient des signes de rétablissement autour de 11h30. Le PDG de la start‑up d’IA Perplexity a précisé que le service était indisponible et que le problème provenait d’AWS.

Éléments techniques et état de la restauration

Selon Downdetector, le dysfonctionnement a aussi affecté des plateformes de streaming comme Prime Video, propriété d’Amazon. À la mi‑journée, AWS a indiqué que la plupart des opérations du service fonctionnaient à nouveau et a expliqué que le problème provenait d’un domaine DNS; le service prévoit toutefois des ralentissements temporaires jusqu’à la résolution complète.

Des ralentissements avaient été observés dès 9h11, et des taux d’erreur importants pour les requêtes adressées à DynamoDB, base de données largement utilisée par de nombreuses applications web et jeux en ligne, avaient été signalés plus tôt dans la journée.

Contexte et enseignements

AWS, filiale d’Amazon et acteur clé du cloud, fournit des services à la demande tels que stockage, bases de données et intelligence artificielle. Le site de maintenance indique que la panne impliquait une zone critique de l’infrastructure située dans la région « US‑EAST‑1 », dans le nord de la Virginie, renforçant le débat sur la concentration des clients chez certains fournisseurs extérieurs.

Des experts mettent en lumière les défis liés à la dépendance envers des prestataires externes pour des services essentiels et l’impact potentiel sur la continuité des activités à l’échelle mondiale. Des épisodes similaires ont été observés par le passé: en juillet 2024, une panne liée à une mise à jour logicielle de CrowdStrike sur Windows avait paralysé des aéroports, des hôpitaux et d’autres organisations, touchant environ 8,5 millions d’appareils selon Microsoft. Ces incidents soulignent l’importance de diversifier les architectures et de prévoir des mesures de sauvegarde et de reprise après incident.

You may also like...