概要 システムを運用していると、様々なトラブルが発生する。 サーバのレスポンスが突如遅くなり、その原因を突き詰めるということはインフラエンジニアとして日用茶飯事。 また、トラブルシューティングの方法はエンジニアによって様々だったりする。 自分の場合は dstatコマンドでリソース状況を大雑把に確認 topコマンドでCPU/メモリー毎にソート psコマンドでプロセスの状態を確認 netstatで状態確認 という順番で調査するようにしている。 このように調査することにより、 遠くからどこが問題なのかざっくり見つつ、 問題を突き止めることが比較的容易になるからだ。 dstatコマンドでリソース状況を大雑把に確認 とりあえず最低限必要な情報を表示する。