タグ

障害と事例に関するkoemuのブックマーク (6)

  • 2017年8月25日の大規模インターネット障害:Geekなぺーじ

    先週の金曜日、Googleが誤った経路をインターネットに流したことによって、大規模な通信障害が発生しました。 大きな影響を受けたのが日のOCNとKDDIだったとされていますが、様々な事業者が影響を受けたようです。 ネットワーク障害 グーグルが設定誤りで謝罪 グーグルが謝罪 大規模ネット障害、装置の誤操作が原因 ニュース解説 - 米グーグルの設定ミス、なぜ日の大規模ネット障害を引き起こしたのか?:ITpro BGP leak causing Internet outages in Japan and beyond 8月25日に発生した大規模通信障害をまとめてみた 今回の障害は、世界中の組織とBGP(Border Gateway Protocol)で繋がっている巨大なネットワークを持つ「Googleだからこそ」の事例と言えそうです。 ここでは、その理由を紹介します。 ネットワークのネットワ

  • 実践!ヌーラボサービスでの CloudFront の障害対策 | 株式会社ヌーラボ(Nulab inc.)

    CDNが単一障害点にならないようにするために ヌーラボでは 2010 年 Cacoo の商用サービスの開始に合わせて AWS における運用を開始しました。当時、運用環境として AWS を採択する決め手の一つになったのが CloudFront でした。その後も着々とエッジロケーションは増え、独自ドメインのサポートなど魅力的な機能も提供され、今ではヌーラボの全サービスの静的ファイルの配信で利用している、無くてはならないサービスとなっています。 その魅力の反面、CloudFront の障害は、アプリケーションそのものに問題がなくても、以下のような表示が崩れた画面が表示されて、ユーザが全くサービスを使えなくなるという、その影響が非常に大きいものです。また障害の原因が DNS やネットワークの経路における問題といった、私たちが直接解決しにくい領域にあることもしばしばです。 ただ、どんな事情であれ、障

    実践!ヌーラボサービスでの CloudFront の障害対策 | 株式会社ヌーラボ(Nulab inc.)
    koemu
    koemu 2014/11/28
    Cacooってアプリ側でもヘルスチェックしているのか。すごいな。
  • データセンター移転とDRBD - Cybozu Inside Out | サイボウズエンジニアのブログ

    @ymmt2005 こと山泰宇です。今回は去る 5 月から 6 月にかけて行った、cybozu.com のデータセンター移転作業について、失敗してしまったことを中心に解説します。 失敗と書いたのは、移転作業中に何度か、一部のお客様環境でストレージ高負荷による障害を起こしてしまったためです。移転作業自体はスケジュール通り進行し、6 月第二週に完了しています。障害に関しては、こちら(PDF)でお詫びとご報告をしていますが、この記事では技術面ならびに障害を引き起こすにいたった背景について詳述します。 移転に至った背景 移転方式の検討 ストレージ同期の方法 DRBD による同期の詳細 まずは自社環境を移転、成功 そして障害は発生した なぜ障害につながったのか まとめ 移転に至った背景 まず、なぜデータセンターを移転することにしたかを説明します。 端的に言うと、当時のデータセンターが手狭になり拡張

    データセンター移転とDRBD - Cybozu Inside Out | サイボウズエンジニアのブログ
  • Eメールリアルタイム送受信システムの通信障害について | 2013年 | KDDI株式会社

    2013年4月16日から19日、au携帯電話サービスでEメールのリアルタイム送受信を設定している一部のお客さまにおいて、Eメールがご利用いただけない、または、しづらい状況が発生しました。 対象となりましたお客さまは、4月19日2:54より通常どおりサービスをご利用いただける状況となっております。 お客さまに多大なご迷惑をお掛けしましたことを深くお詫び申し上げます。 今回の障害の内容と対策は、別紙のとおりです。 当社は、今回の障害発生を真摯に受け止めて電気通信事業者として深く反省し、再発防止の徹底に努めてまいります。 別紙: Eメールリアルタイム送受信システムの障害について (2.1MB) なお、障害にともない、「メールが表示されない」あるいは「連絡先が表示されない」場合は、再同期を行うことで表示されます。 以下の再同期方法をご確認ください。 メールが表示できない場合はこちら 連絡先が表示

  • ウノウラボ Unoh Labs: サービスの開発と運営をする上での問題の切り分け(ドメイン・DNS編)

    普段バランスボールに座って仕事をしているのにWBSの撮影は普段ボールで仕事をしていない人が軒並みボールに座るので自分の分がなくなって撮影中のテンションが下がってしまったアンケートに英語キーボードの人+1できなかったjokagiです.上鍵のタイプの英語キーボードってかなり少なくて困ってます. そういえばなんとか正式採用になってプロフィールに掲載されました. あらためてよろしくお願いいたします. さて今回はウェブ開発というかインターネット向けサーバー&クライアントな開発をする上で「問題の切り分けちゃんとできるようになりましょう」という話です. 問題の切り分けちゃんとできてますか? あるサービス,わかりやすいのはウェブサービスを開発していると,普通さまざまな問題がでてきます. スクリプトなどロジックの問題の場合は解決できる人は多くいらっしゃるのですが, 「サーバーにつながらない」という現象に対し

    koemu
    koemu 2007/01/17
    チェック項目があるとないとでは違う
  • トラブル対策は「想像力」が決め手

    10月11日夜7時,久しぶりに神田神保町へ出かけた。を買うのが目的ではなく,営業についての講演をするためだ。先月は社内で若手社員を対象にした営業の講演をしたのだが,今月はこのコラムを読んだ社外の方から講演依頼が来たのだ。毎月1回,いろいろな業界の営業マンや経営者が集まって,営業の勉強会をしているという。 ふだん情報通信にかかわる人とは研究会のメンバーはじめ広く付き合っているが,異業種の人と接する機会は少ないので軽い気持ちで引き受けた。生命保険会社,リース会社,広告会社と多彩だ。1時間余りの短い時間だったが,皆さん笑いながら聴いてくれたので,まずは成功だろう。技術の話抜き,スライドも使わずの私の営業話がどの業界の人にも通じることが分かった。 さて,今回も前回に続いて営業話を書いたのでは,ITproでなく,SalesPROになってしまうので書かない。久しぶりにトラブル話を書こうと思う。どんな

    トラブル対策は「想像力」が決め手
    koemu
    koemu 2006/10/30
    トラブルになってもいつも通り段取りよく
  • 1