とてもツマらない障害対応のメモとなります。 が、英語圏には多少の情報はあったけど日本語になかったので、書き留めておきます。 障害内容 ある日、突然、OpenStack Grizzlyの管理画面からインスタンス作成などの操作が全てできなくなりました。 既存のインスタンスには特に影響なく稼働していました。 原因 動作的には、認証システムであるKeystoneと、それ以外の全てのコンポーネントとの認証が失敗することが原因となりました。 nova list や glance image-list などが Unauthorized 401 になる状態です。 根本的な原因は、Keystone管理のSSL証明書の期限が切れたことによるものでした。 調査内容 初めはトークンデータが溢れて記録できなくなったのかと思いましたが、keystone-manage token-flush を実行しても特に解決できず
![OpenStack Grizzlyを1年運用して起きた認証システム障害 | 外道父の匠](https://cdn-ak-scissors.b.st-hatena.com/image/square/35e39cda8b3814590c09261f4b5f5c3899facf5b/height=288;version=1;width=512/https%3A%2F%2Fblog.father.gedow.net%2Fwp-content%2Fuploads%2F2015%2F11%2Fthumbnail-okinawa-2013.jpg)