少々可愛がり方が足りなかったのか、SecondaryNameNodeでメモリ不足が発生して、機能が停止してしまいました。 その際の調査や修復の記録になります。 SecondaryNameNodeのおさらい SNNの機能を復習するとこんな感じ。 SNNが定期的にNameNodeからfsimageとeditsログを取得する SNNでfsimageにeditsを適用する NameNodeにfsimageを送り返す NameNodeとSNNにデフォで2世代分のfsimageが残る NameNodeのedits_inprogressがeditsにローテートされて新しいedits_inprogressが始まる 障害内容 現象 SNN起動時は正常にfsimageを送り返してるように見える period秒後の2回目以降はNameNodeに接続しようとすらしない SNN管理画面 http://localho