タグ

障害に関するm-kawatoのブックマーク (14)

  • 「平常時の14倍に耐える構成に再設計」、KDDIが年末年始の障害の原因と対策を公表

    KDDIは2013年1月16日、2012年12月31日と2013年1月2日に起こった「4G LTEサービス」の通信障害、および1月1日に起こったau ID認証決済システムの障害について、障害発生の経緯と対策について、説明会を開いた。 4G LTEの通信障害は、まず12月31日の午前0時から午前4時23分にかけて4時間23分の間、データ通信できない、または利用しづらい状況になった(関連記事)。影響は全国の最大約180万人に及んだ。 今回の説明によると、原因はLTEの信号中継装置と信号制御装置の間の認証応答のタイムアウト値に不整合があったことにあるという(写真1)。 KDDIの4G LTEでデータ通信を利用する場合、月間7Gバイト以上などデータ通信の総量に応じた速度制限をかける。これをカウントする「利用通信量制御認証」を行うために、LTE端末は信号中継系の装置を介して「加入者プロファイルサーバ

    「平常時の14倍に耐える構成に再設計」、KDDIが年末年始の障害の原因と対策を公表
    m-kawato
    m-kawato 2013/01/16
    あとで読む
  • ドコモ、相次ぐ通信障害を謝罪--原因と対策を発表

    NTTドコモは8月7日、都内で記者会見を開き、7月25日に発生したspモード設定サイトにおける障害と、8月2日に発生した通信障害を謝罪するとともに、今後の対策を発表した。すでに総務省には障害を報告済みだという。 会見に出席したNTTドコモ代表取締役副社長の岩崎文夫氏は、「今年のはじめに発生した一連の通信障害およびそれに対する対策をしっかりやってきたつもりだったが、今回また通信障害を起こしてしまったことを大変申し訳なく思っている」と謝罪。改めて再発防止につとめるとした。 「spモード」のメアドが他人に変更される障害 7月25日の午前1時41分~9時14分に発生したのが、一部ユーザーの「spモード」の設定情報が、他のユーザーから閲覧・変更可能になってしまう事象。原因は、spモードの設定変更サイトへのアクセスを管理するサーバで、ソフトウェア更改を行った際に、データ設定に誤りがあったためとしている

    ドコモ、相次ぐ通信障害を謝罪--原因と対策を発表
  • NTTドコモがspモード障害の経過報告、「ソフト更新時にテーブルのデータが違う値に」

    NTTドコモの加藤薫社長(写真)は2012年7月27日、同社の第1四半期決算の会見で、同月25日に発生したスマートフォン向けのサービス「spモード」の各種設定のトラブル(関連記事)について謝罪するとともに、現時点での調査結果を報告した。 今回のトラブルは、メールの認証システムそのものに根的なミスがあった2011年12月の障害(関連記事)と異なり、他人のメールアドレスや無線LANなど各種設定情報が表示される、場合によってはこれらの設定を変更できてしまうというものである。加藤社長は「前回のような来のメールをやり取りする部分の障害ではなく、各種設定のトラブルではあるが、ご迷惑をおかけしたのは同じ。影響範囲は1000人弱と捉えている。現在はトラブル対象となったユーザーを特定し、個別対応を進めることを最優先している」と話した。 「初期設定のパスワード変更を呼びかけていく」 今回のトラブルの原因は

    NTTドコモがspモード障害の経過報告、「ソフト更新時にテーブルのデータが違う値に」
  • 27日未明のTwitterダウン、原因は五輪サッカー戦ではなくDC障害

    Twitterの日法人であるTwitter Japanは2012年7月27日、日時間の深夜0時20分から1時までの間、Twitterサービスが停止していたことを同社ブログ上で公表し、謝罪した。サービスが完全に復活したのは1時25分ころだったという。 ちょうどロンドンオリンピックのサッカー男子、日スペイン戦の最中だったため、大量の応援や実況ツイートが集中してシステムダウンが起こったのではないかという憶測も一部で流れたが、Twitter Japanによれば、原因は「Twitterのデータセンター(DC)のシステムの問題」だったという。 同社によると、Twitterサービスに使っているデータセンターでは、システム障害が起こった場合、自動的に別のシステムに切り替えて処理を続行する冗長構成をとっている。しかし、今回は両方のシステムに同時に障害が発生したため、サービスが停止してしまったという

    27日未明のTwitterダウン、原因は五輪サッカー戦ではなくDC障害
  • ドコモからのお知らせ : 「spモード各種設定」における発生事象について | お知らせ | NTTドコモ

    お客様の設定により、お客様情報が「非表示」となっております。お客様情報を表示するにはdアカウントでログインしてください。 お客様情報表示についてへ お客様情報表示についてへ ドコモからのお知らせ 「spモード各種設定」における発生事象について 2012年7月25日 平素はNTTドコモのサービス・商品をご利用いただき、誠にありがとうございます。 2012年7月25日(水曜)1時41分から9時14分において、以下の事象が発生いたしました。なお、事象の防止のため、「spモード各種設定」サイトを一時停止しておりました。 お客様には多大なご迷惑をお掛けしておりますことを、深くお詫び申し上げます。 1.発生日時 2012年7月25日(水曜)1時41分〜9時14分 ※9時14分から13時37分まで「spモード各種設定」サイトを停止しておりました。13時37分以降は正常に設定できております。 2.影響を

  • 【かなり復旧】Amazon EC2で大規模電源障害発生 Instagram、Pinterest、Flipboardなどがダウン

    追記 どうやら、Flipboardもダウン中のようです。 @atsukikodou 現在Flipboardのサービスがダウンしています。復旧に向けて取り組んでいますので、少々お待ちください。ご利用ありがとうございます! — Flipboard Japanさん (@flipboard_jp) 6月 30, 2012 電源障害はウェストバージニアの落雷が原因のようです。 EC2はまだ部分的な復旧のようです。PinterestとFlipboardは復旧していますが、Instagramはまだのようですね。 We're back! Our team is continuing to work on some remaining issues that may impact performance. Thanks for your patience and happy pinning! — Pinte

    【かなり復旧】Amazon EC2で大規模電源障害発生 Instagram、Pinterest、Flipboardなどがダウン
  • Amazonクラウド先週のシステム障害、原因は電源トラブル。二重三重の防護策が次々と倒れる

    先週6月14日に発生したAmazon Web Servicesの米国東部リージョンでのシステム障害は、HerokuPinterestなど大手のサービスにも影響を与えたようです。その障害報告が、Service Health Dashboardで公開されています(現在はRSS内の記述として読めます)。 障害は米国東部リージョンでの特定のアベイラビリティゾーンで発生したもの。報告によると、プライマリの電源ケーブルのトラブルをきっかけにバックアップとしての発電機へ移行したものの、そこでもまたトラブルが発生し、二重、三重の防護策が次々に倒れていったことが示されています。 Amazonクラウドの多重の防護策の一端が分かると共に、これだけバックアップ策が用意されていても、わずかなトラブルによって防護策が倒れることの教訓を得ることができます。 一方で、障害は特定のアベイラビリティゾーン内だったため、マル

    Amazonクラウド先週のシステム障害、原因は電源トラブル。二重三重の防護策が次々と倒れる
  • ファーストサーバで大規模なデータ障害 顧客データが消失

    サーバホスティング事業者のファーストサーバで大規模なデータ障害が発生し、顧客のデータが消失したことが明らかになった。 サーバホスティング事業を手掛けるファーストサーバは、提供中の一部のサービスで大規模なデータ障害が発生し、顧客のデータが消失したことを明らかにした。 対象サービスは「ビズ」「ビズ2」「エントリービズ」「EC-CUBEクラウドサーバ マネージドクラウド」および、これらのサービスを利用したオプションサービス。(1)サーバ上にアップロードされたデータ(FTP、ファイルマネジャーなど)、(2)コンフィグレータ設定を含むデータ、(3)メールボックス内のデータ――が消失し、サーバを随時初期化して提供しているという。 同社は6月20日午後5時50分ごろに障害の発生を認識し、翌21日未明にメンテナンスに用いる管理プログラムにバグがあったことを確認。同時に顧客データが消失したことも確認した。現

    ファーストサーバで大規模なデータ障害 顧客データが消失
  • auメール送受信が障害--2月11日夜に約3時間半で復旧

    KDDIは2月11日、同日20時35分から一部の顧客においてEZwebのメール送受信が利用しづらい状況が続いていたと発表した。対象地域は全国で、小山ネットワークセンター内の電源設備の故障が原因だという。対象となったサービスはau携帯電話、スマートフォンにおけるEメール送受信(ezweb.ne.jp)。その後同日23時59分に復旧した(2月12日1時現在の情報)。当初、2月11日22時45分現在の情報では「auデータ通信に利用しづらい状況が発生し障害が継続中」としていたが、2月12日5時現在の情報では「音声利用およびデータ通信には影響はなかった」とされた。 KDDIは、2月9日夕方に最大130万人に影響する通信障害を起こしたばかり。NTTドコモは相次ぐ通信事故で総務省から指導を受け、3月30日までに再発防止策を報告することになっているが、KDDIの通信障害も相次いでいる。 ◆総務省が指導 総

    auメール送受信が障害--2月11日夜に約3時間半で復旧
  • 【続報】ドコモの通信障害、パケット交換機の更新がきっかけ - ニュース:ITpro

    2012年1月25日午前中に発生したNTTドコモの通信障害は、25日未明から新型パケット交換機の格運用を始めたことがきっかけだった(関連記事:ドコモの東京エリア通信障害が復旧、最大約250万人に影響)。 NTTドコモは、スマートフォンの利用者増に伴う通信インフラ増強のため、1月20日から最新型パケット交換機の試験運用を始めたという。5日間にわたって安定的に運用できたことから、25日未明から収容エリアを拡大、格運用に移った。 障害が発生したのは、同日の8時26分。格運用を始めたばかりのパケット交換機の動作が不安定になり、処理能力が低下した。 さらにその30分後、午前9時すぎにJR山手線でトラブルが発生したのを機に、乗客が一斉に通信を始めるなどしてトラフィックが急増。パケット交換機の処理容量を超え、自動的に通信規制がかかった。 NTTドコモは午前11時ごろにパケット交換機を元の構成に戻し

    【続報】ドコモの通信障害、パケット交換機の更新がきっかけ - ニュース:ITpro
  • 通信障害のお知らせ : 【回復】全国でspモードメールがご利用しづらい状況について (回復報 1月2日 2:00更新) | お知らせ | NTTドコモ

    平素はNTTドコモのサービス・商品をご利用いただき、誠にありがとうございます。    全国でspモードメールがご利用しづらい状況が発生し、お客様には多大なご迷惑をお掛けしております。現在復旧作業に努めておりますので、何卒ご理解を賜りますよう宜しくお願い申し上げます。 1.発生日時  2012年1月1日(日曜) 午後9時30分頃  ※現在、復旧に向けて作業中です。 2.影響地域及び影響を受けると想定されるお客様  全国でspモードメールをご利用のお客様 3.状況  spモードメールがご利用しづらい状況  (午後10時35分頃に回復しましたが、午後11時03分頃にご利用しづらい状況が再発しました。) 4.原因  ドコモの通信設備の故障

  • Twitterの「あけおめ」vs「バルス」の強さを比較したグラフ

    及び全世界のつぶやき数を集めてグラフ化しているtweet counterが、「あけおめ」ツイートと「バルス」ツイートのそれぞれのピークを合わせてどちらの方がより強力だったのかを分かりやすく示すグラフを作っています。 tweet counter : あけおめツイートは TPS に注目 http://hide.dnsalias.net/tweetcounter/newyear_vs_bals.cgi 青色があけおめ、赤色がバルス。2秒平均の全世界グラフではこうなっています。バルスの時の方が多い。 ところが5秒平均の全世界グラフを見るとこうなります。あけおめの方がバルスよりも多いという結果に。 さらにこちらのページに表示されている国内グラフを見るとこうなっています。これが日国内の10秒平均。 そして全世界の10秒平均です。 要するに、「バルス!」はその一瞬だけですが、「あけおめことよろ!」

    Twitterの「あけおめ」vs「バルス」の強さを比較したグラフ
  • 2011年9月21日に発生した東日本におけるネットワーク障害に関する経緯と対処について |

    2011年9月28日 UQコミュニケーションズ株式会社 2011年9月21日に発生した東日におけるネットワーク障害に 関する経緯と対処について 2011年9月21日17時45分から2011年9月22日13時頃までの間、東日全域のWiMAXサービスにおいて通信が出来ない状況となり、多数のお客様にご不便をおかけしましたことを深くお詫び申し上げます。 今回発生したネットワーク障害について、発生までの経緯とこれまでの対処について下記の通りご報告申し上げます。 今後は、システムと運用の更なる安定稼働に努めてまいります。 記 1.障害発生時刻 2011年9月21日17時45分 から 2011年9月22日13時頃 (約19時間15分) *埼玉県、神奈川県、山梨県 (22日午前8時00分頃に復旧) *北海道、青森県、岩手県、秋田県、宮城県、山形県、福島県、茨城県、栃木県、群馬県、 千葉県、新潟県 (2

    2011年9月21日に発生した東日本におけるネットワーク障害に関する経緯と対処について |
  • ドコモのspモード、障害の原因は中継ルーターの故障

    2011年8月16日に発生したNTTドコモのspモードのトラブルの原因は、FOMAのコアネットワークを構成する中継ルーターの故障だとわかった。 トラブルが起こったのは、FOMA網でパケット通信を担うSGSN/GGSNと呼ばれるゲートウエイ装置と、MAPS(Multi-Access Platform System)というシステムの間にある中継ルーターMAPSはFOMAを含め様々なアクセス回線から、インターネットや企業システムへの接続を実現するためのプラットフォームで、spモードの契約管理機能やメール対応機能などが含まれる。 中継ルーター自体は単純にパケット転送を行うもので、冗長化されていた。ハードウエア障害が起こった後、冗長構成になっていた機器への切り替えはすぐに行われたという。ところが機器の切り替えをきっかけに、それまで接続していたセッションが切断されて新規接続(再接続)になったユーザー

    ドコモのspモード、障害の原因は中継ルーターの故障
  • 1