米Amazon Web Services(AWS)チームは、米東リージョンで10月22日に発生した障害の原因や対応についてまとめた報告書を公表した。DNSの変更が引き金となってメモリリークのバグが誘発され、障害につながったと報告している。 AWSの障害は現地時間の22日午前10時ごろ発生し、米東リージョンにあるAmazon Elastic Block Store(EBS)の一部でパフォーマンスが低下し、I/Oリクエストが処理できないなどのスタック状態に陥った。根本の原因は、EBSストレージサーバで実行していた情報収集エージェントに潜在するバグにあったという。 この前の週に、情報収集サーバの1つでハードウェアに不具合が生じたため入れ替えを行い、この入れ替えに伴ってDNS記録を更新、障害の起きたサーバを削除して、入れ替えたサーバを追加した。ところがこの更新が社内の全DNSサーバに行き渡らず、結
![AWSの障害はメモリリークのバグに原因、Amazonが報告書公表](https://cdn-ak-scissors.b.st-hatena.com/image/square/1e94764169c765412b22cf12f9969fcd0b5bba0c/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fait%2Farticles%2F1210%2F29%2Fmt_aws.gif)