タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

障害に関するhikute_amataのブックマーク (3)

  • 運用における障害対応の基本 - システム障害といかに向き合い、チームとして対処するか - Qiita

    はじめに システム開発をしていると、初期構築フェーズが終わった後に必ず保守・運用フェーズがやってくる。 番運用をしているシステムで障害が発生した時に、いかに向き合い、対処するかという考え方とアクションをまとめた。 これから運用を始めたばかりという方や、障害対応にあまり慣れていない方が対象。 障害とは何か システムにおける障害とはそもそも何か。 非常にざっくり分類すると、一般的には下図の黄色で塗りつぶしたところのどれかに該当すると思う。 何をもって障害とするか、はサービスやユーザーの性質により判断が分かれると思うが、「エンドユーザーがサービスを利用する上で不都合を感じ、かつ、それがサービスプロバイダの想定外の事象であった場合」とすることが多いのではないか。 よくある話で、「これ障害だよね?」「いえ、仕様です」という会話が生まれることがある。入力に対して適切な応答を返しているが、そもそもその

    運用における障害対応の基本 - システム障害といかに向き合い、チームとして対処するか - Qiita
  • システム障害と僕達はいかにして戦えば良いのか、障害対応について考えた - Qiita

    IT界隈でエンジニアしていると、よく出くわすのが障害対応です。できれば会いたくないという人が多いと思うんですが、僕はけっこう好きです。障害対応。どこに原因があるのか調査をして、バランス良くベターな対応をしたときの楽しさは、プログラミングとはまた違ったものがあります。探偵っぽい感じが面白いですよね。もちろん、障害が発生しない状況を作るのが一番です 弊社では数多くのWebサービス/アプリを運営しているので、過去様々な障害対応をしてきました。その際に、解決までどんな道筋を僕がたどるのかを振り返ってまとめてみました。これが大正解なんてことはなく、人や事象によって違うとは思いますが。 なお、障害検知手法とか、サーバのコマンドとか、コードのデバッグ手法とか、具体的なことは一切出てきません。手続きと思考プロセス的な話です。 障害対応フローチャート 一般的な感じだと思いますが、障害報告から対応完了までのフ

    システム障害と僕達はいかにして戦えば良いのか、障害対応について考えた - Qiita
  • メルカリでアクセス障害発生、「短時間だからユーザーに案内しない」

    フリーマーケットサービスの「メルカリ」は2017年9月26日21時半頃、サービスにアクセスできない障害が発生した。22時前に障害は解消。20分ほどの間、商品の閲覧や購入、取引の確認などができなかった。

    メルカリでアクセス障害発生、「短時間だからユーザーに案内しない」
    hikute_amata
    hikute_amata 2017/09/27
    一時的に見えない時間がありましたとお知らせだけでもすればいいと思う。自分のパソコンや通信に原因があったのかと思うので。
  • 1