タグ

障害に関するokyawaのブックマーク (4)

  • 【8/23 AWS大障害】障害が起きたサービスは、どのように復旧させたのか〜障害内容の解説と対策〜 - Qiita

    起きた事象 AWSの 「Amazon Elastic Compute Cloud」(EC2) 「Amazon Relational Database Service」(RDS) がAZ ID:apne1-az4のアベイラビリティゾーンで使えない状況になった。 時間 12:36頃に当事象が発生。 18:30頃に、大半のインスタンスの復旧が完了(AWS公式より) 私が受けた障害としては、22時頃にようやく全てのRDSが復旧した。 実質9時間ほどの大障害だった。 アベイラビリティゾーンとは 東京リージョンには3つのアベイラビリティゾーン(ざっくり言うと、データセンター)がある。 それぞれのアベイラビリティゾーンは、リージョンコードとそれに続く文字識別子を用いて下記のように表される。 ap-northeast-1a ap-northeast-1c ap-northeast-1d ただ、AWSアカウ

    【8/23 AWS大障害】障害が起きたサービスは、どのように復旧させたのか〜障害内容の解説と対策〜 - Qiita
  • 原因調査用Linuxコマンド | 外道父の匠

    サーバの動作に異常が発生した際に原因を探るためのLinuxコマンドで、自分用のメモです。 全てmanとかググったら出てくるので説明は適当です。思いついたら後で追記していくかもです。 対象はDebian Squeezeになります。 全てパッケージインストールできるもので、パッケージ名は [in packagename] としてあります。 各所よりコメントありがとうございます。 良さ気なコマンドは追記していきます。 <追加したコマンド> * telnet (+コメント wget, netcat) * arp (+コメント arpwatch) * pstree * fdisk コメントに gdisk * host, dig * watch * reboot

    原因調査用Linuxコマンド | 外道父の匠
  • AWSの障害に起因したHerokuの障害について、Herokuによるレポートが公開されたので要点を翻訳しました(全訳ではありません)。「だ、... - Sooey

    AWSの障害に起因したHerokuの障害について、Herokuによるレポートが公開されたので要点を翻訳しました(全訳ではありません)。「だ、である」調にしたため多少偉そうに見えるかもしれませんが、原文はとても誠実な表現で書かれていますので、その点は誤解なきよう。 一部、文意が汲めなかった部分は原文を併記していますので、ご意見・ご指摘などがありましたら@junyaまでお願いします(@irohirokiさん、アドバイスありがとうございます)。 Resolved: Widespread Application Outage Herokuを4年間運用してきて最大の障害 専用データベースを利用している大規模アプリケーションでは最大16時間のダウンタイム 共有データベースを利用している小規模アプリケーションでは最大60時間のダウンタイム アプリケーションのデプロイについてはプラットフォームの広範囲にわ

  • 上海IT管理者の ひとり言 – 上海で体験したことやIT事情について

    on 10 4月 2024 投稿者: 上海IT管理者 インターネット, インフラ, サーバー 送信ドメイン認証 – DMARCへの対応 スパムメール、ゴミメール、なりすましメール等々…. 迷惑メールが毎日届きます。ただしほどんどの迷惑メールは受信ボックスへ 配信される前にスパム対策のメールゲートウェイによって拒否および隔離 されていると思います。 SPF,DKIM…昔から様々な対策が導入されております。 今はメールはクラウドを利用されている企業様がほどんどだと思いますが、 最近、クラウド事業者から「DMARCへ対応してください」という連絡は ありませんでしょうか? DMARCとは簡単に言えば迷惑メール対策です。 DMARCを導入するにあたり「SPF」と「DKIM」を導入する必要があります。 【SPF(Sender Policy Framework)】 ドメインを管理しているDNSサーバーに

  • 1