タグ

障害対応に関するgologo13のブックマーク (2)

  • チーム状態をスムーズに変えて障害対応のコストと精神的負荷を抑える - CARTA TECH BLOG

    こんにちは。 @at_grandpa です。普段はバッチを書いたりメンテナンスをしています。 今回は、先日起きた障害対応の時、チームの状態をスムーズに変えることで対応コストと精神的負荷を抑えられた、ということを書きます。 目次 目次 障害発生 普段の対応 今回の対応 原因究明と現状把握 関係者が会議室に集まる 対応用Slackチャンネルを開設 ペアワークで実対応 落ち着いたら自席&Slackコミュニケーションへ移る 対応完了の確認と報告・チケットまとめ まとめ 障害発生 先日の朝に「レポートの数値がおかしい」という連絡がきて確認したところ、とあることが原因で、バッチの自動実行が約半日行われていないことがわかりました。 普段の対応 普段の対応は以下のような形です。 エラー発生をSlackの全体チャンネルで報告 バッチ系チャンネルにて、考えや現状を垂れ流す わからないことがあれば有識者にメンシ

    チーム状態をスムーズに変えて障害対応のコストと精神的負荷を抑える - CARTA TECH BLOG
  • 恥かどうかはともかく、そもそも逃げられない障害対応のお話 - Qiita

    システムエンジニア Advent Calendar 2016の20日目の記事だよ! 昨日は@sh-ogawaさんの「SIerが実践する分散開発とバージョンコントロール」でした!! システム障害のお話 は〜い、こんにちは!いよいよクリスマス間近ですね! この時期になると、キャッキャウフフの予定も盛りだくさんだと思います!1 そんな大事な日に限って起こるのがあれです。 そう、みなさんもよくご経験されているだろう、システム障害です2。 システム障害 それはツラく長く険しい道のりを告げるゴングです。 今回は、その障害対応のお話をしたいと思います。 この記事のアジェンダはだいたいこんな感じです。 報告する はい、システム障害が起きました〜。 キタ━━━(゚∀゚)━━━!! 「マジでか…(´;ω;`)ブワッ」 「なんで今日なんだよ〜( ;∀;)」 障害発生時の想いは人それぞれだと思いますが、まず最初

    恥かどうかはともかく、そもそも逃げられない障害対応のお話 - Qiita
    gologo13
    gologo13 2017/01/05
    障害対応重要
  • 1