タグ

障害と2007に関するobata9のブックマーク (24)

  • ログイン障害前にも兆候──大規模障害の全貌、Skypeでも「はっきりしない」

    「ログイン障害前にもチャットが送れないなどの兆候はあった」──。Skype日オフィスの岩田真一ジェネラルマネージャーは、8月24日に都内で開かれた記者会見で、今月16日に発生した障害について説明した。 Skypeにログインできなくなる障害は、8月16日から18日にかけて発生した。2日前の14日には、月例のWindowsセキュリティプログラムが公開されており、Skypeのネットワークに何らかの影響を与えたのではないかとの見方もあった。 この点について、岩田氏は「Windows Updateはきっかけの1つにすぎない」とした上で、障害自体は「Skypeネットワーク自体の問題」と強調した。 Skypeネットワークにログインする時、クライアントはまず「ログインサーバ」にログインし、次いでコンタクトリストの処理や通話のルーティングを行う「スーパーノード」に接続する。このスーパーノードは、Skyp

    ログイン障害前にも兆候──大規模障害の全貌、Skypeでも「はっきりしない」
  • Skype障害、「日本での対策も強化したい」と岩田GM

    Skypeの日オフィスは8月24日、東京都内で国内ビジネスの最新状況について説明を行った。16日に発生した世界規模のサービス障害について、岩田真一ゼネラルマネジャーは「Skype社内の問題」と話し、噂されるMicrosoft Windows Updateとの因果関係を否定した。 Skypeのサービス障害は8月16日に発生し、ユーザーがサービスにログインできないという事態が19日ごろまで続いた。同社は21日に、「P2Pネットワークの急激なリソース低下と急増したログイン要求の処理が機能しなかった」とする原因説明を行った。 障害の発生当初、14日に公開されたWindows Updateが原因だとする噂が駆け巡ったが、SkypeとMicrosoftは検証を行ってこの説を明確に否定(関連記事)。今回のWindows Updateでは、アップデート後にPCの再起動を行ったユーザーが折りしも続出したた

    Skype障害、「日本での対策も強化したい」と岩田GM
  • MSパッチは障害の原因ではない――Skypeが改めて説明

    Skypeの大規模サービス障害は、Microsoftの月例パッチが原因ではない――Skypeは8月21日、障害の原因について改めて説明した。 Skypeは20日にサービス障害の原因について、「Windows Update経由で月例パッチが配布された後、短時間の間に世界中の多数のユーザーが自分のマシンをリブートし、これがSkypeのP2Pネットワークリソースに影響した」と説明していた。だがこれが一部で誤解を招いたとして、改めてMicrosoftのパッチとの関連を明確にした。 Skypeは、Microsoftを非難しているわけではないとし、Microsoftのパッチはサービス障害を引き起こした一連の出来事の引き金にすぎず、根的な原因ではなかったとしている。Skypeはこれまでも定期Windows Updateに伴う再起動に対応してきたが、問題が起きたことはなかった。ただし今回は例外的で、当日

    MSパッチは障害の原因ではない――Skypeが改めて説明
  • Skype障害,「Windows Updateはあくまでもトリガー」と説明

    ルクセンブルクのスカイプテクノロジーズは2007年8月21日,16日に発生した通信障害について同社のブログで「Windows Updateは一つのトリガーであって根原因ではない」というコメントを発表した。前日に投稿したブログによって「Windows UpdateがSkypeのシステム・ダウンの原因という誤解が生じた」として,新たな記事をアップしたのだという。 この投稿では「すべての責任はSkypeにあるのであって,米マイクロソフトには全く責任はない」と明言。障害に当たってマイクロソフトは非常に親切に助けてくれたという。 障害はWindows Updateによってユーザー情報を分散して管理する「スーパーノード」が同時に再起動。各クライアントからのログオン要求が集中し,P2Pネットワークが不安定になったと説明している。「来であれば,こうしたケースでもP2Pネットワークを自動復旧するメカニ

    Skype障害,「Windows Updateはあくまでもトリガー」と説明
  • 「Skype障害と月例パッチは無関係」、MSが強調

    Skypeの大規模障害とMicrosoftが8月14日に公開したセキュリティパッチとの関係が取りざたされていることについて、米Microsoftセキュリティブログで20日、「Skypeの障害とMicrosoftのパッチは無関係」と強調した。 Skypeは今回の障害について、「Windows Updateを通じて定例パッチを受け取った後、短時間の間に世界中の多数のユーザーが自分のマシンをリブートしたことが障害の引き金になった」とサイトで説明。これを受けて、Microsoftには顧客からの問い合わせが相次いだという。 しかし「今月のパッチリリースに普段と違うことは何もなかった」とMicrosoftは強調。「Skypeが説明している通り、問題はSkypeソフトのバグにあり、14日のアップデートとは関係ない」と述べている。 MicrosoftはSkypeから連絡を受けて、調査に協力したという。ま

    「Skype障害と月例パッチは無関係」、MSが強調
  • Skype不安定化の原因は「Windows Update」だった:ITpro

    2007年8月16日~18日にかけてSkypeが不安定になっていた原因は,Windows Updateだったと,同社担当者がブログで明かした。当初は「あるソフトウエア」が原因と記載していたが,これをWindows Updateと明示した。 ブログによると14日に月例のWindowsセキュリティ・パッチが公開され,これらがWindowsパソコンに適用されたことから,短い時間にマシンが一斉に再起動をした。この結果,Skypeのサーバーにログオン要求が集中。ネットワークが不安定になったという。 また,Skypeはネットワークが切断したときに,自動的に再接続する機能があるが,これがバグによりうまく働かなかったために,約2日に渡ってほとんど使えない状態が続いたという。 [関連ブログ情報]

    Skype不安定化の原因は「Windows Update」だった:ITpro
  • 「iPhone」番号ポータビリティの悪夢 - アップルコア

    iPhone」を購入してから3日が経ったが、番号ポータビリティに関する問題はまだ続いている。 2台購入して、ほんとうによかった。1台はいまだに電話番号を移植できず、入手してからこちら「iBrick(レンガと変わりないもの)」化しているのだ。 今のところわたしの「iPhoneエクスペリエンス」は、半分がこの上なくハッピーで、もう半分は悪夢といった様相を呈している。わたしのは、AT&Tの新規アクティベーションを利用してiPhoneを設定したので、作業終了までにわずか3分しかかからなかった。一方わたしは、VerizonからAT&Tへ番号ポータビリティをすることにしたのだが、これがまったくもって最悪の選択だった。 はじめは最長6時間で今の番号を移動できると言われていたものの、その後AT&Tから、作業にはだいたい24時間かかるという電子メールが送られてきた。24時間経過したが何も起こらないため、

    「iPhone」番号ポータビリティの悪夢 - アップルコア
  • IP電話障害長期化の三つの理由 - ニュース - nikkei BPnet

  • IP電話の大規模障害を食い止めよ(2)IP電話障害長期化の三つの理由

    東西NTTのひかり電話の障害だけでなく,IP電話サービスはこれまで数々の障害を起こしてきた。そしてその障害は長時間,広範囲に及びやすい傾向がある。 長期間に及びやすい理由は次の三つ。(1)機器の性能評価の難しさ,(2)他の機器に障害が波及しやすいこと,(3)サーバー再起動が安易にできないこと,である(図3)。これらを克服しないと,IP電話が固定電話並みの信頼性を勝ち取ることはできない。 図3●IP電話のトラブルが長期化する要因 ノウハウの不足や汎用的なサーバー機を組み合わせたシステム構成ならではの障害切り分けの難しさ,さらに緊急通報を担う「ライフライン」として安易なサーバー再起動が難しいことなどがトラブルを長期化している。 性能評価の「考えが甘かった」 2002年4月に商用IP電話サービス「BBフォン」を開始したソフトバンクBBは,サービスを開始した矢先の同年6月,サービス停止にまで至る障

    IP電話の大規模障害を食い止めよ(2)IP電話障害長期化の三つの理由
  • NTT東のフレッツ・トラブル,「ルート再計算により・・・」の真相:ITpro

    NTT東日/西日のひかり電話サービスやフレッツ・サービスはトラブルが続く。その都度、原因を明らかにしてきたが、5月15日に発生したNTT東日のBフレッツのトラブルについてはその原因の説明に納得できなかった。「IP伝送装置のパッケージ交換をきっかけに、ルート再計算の負荷が増え、14都道県のフレッツ網がダウン」。装置が故障するのはよくあること。それに伴うルート再計算で大半のフレッツ網がダウンするとは・・・。やはり、その真相は単純ではなかった。 14都道府県のフレッツ・サービスなどがダウン 5月15日20時、NTT東日は18時44分ごろから「フレッツ・サービス」および「ひかり電話」の一部ユーザーがサービスを利用できなくなっていると発表した。神奈川、千葉、埼玉を除く東日のサービス・エリア14都道県でサービスが利用できなくなった。東京は23区以外の一部のユーザーに影響が出た。 その後、IP

    NTT東のフレッツ・トラブル,「ルート再計算により・・・」の真相:ITpro
  • ITmedia News:ルータ2000台が3秒でダウン 「フレッツ」「ひかり電話」大規模障害

    謝罪する大木一夫副社長(中)と、ネットワーク事業推進部の吉村辰久設備部長(右)、コンシューマ事業推進部の安田雅美営業推進部長 NTT東日のネット接続サービス「フレッツ」と、IP電話「ひかり電話」が5月15日夕から7時間にわたって一部で利用できない状態になった問題について、同社は16日午後に会見を開いて詳細を説明し、謝罪した。 障害の原因はルータの処理能力オーバー。都内にある1台のルータの障害が、同社管内の約4000台のルータに3秒間で伝わり、うち約2000台が機能を停止。北海道、宮城県、群馬県など14都道府県で一斉に障害が起き、ひかり電話は「119番」「110番」など緊急電話も使えなくなった。 同社副社長の大木一夫・ネットワーク事業推進部長は「当社のIP網で起きた過去最大の故障。みなさまに多大なご迷惑をかけ、誠に申し訳ない」と謝罪しつつも「これを教訓に安心・安全のネットワークを構築

    ITmedia News:ルータ2000台が3秒でダウン 「フレッツ」「ひかり電話」大規模障害
  • NTT東フレッツの広域障害、原因はIPルータの処理能力オーバー

    5月15日に発生したNTT東のフレッツサービスなどの大規模障害は、ルータの処理能力に起因するものだった。 14都道府県の広域にわたり、5月15日夕方から深夜にかけてNTT東日の「フレッツサービス」や「ひかり電話」で障害が発生していた事故(16日現在は全面復旧)で、障害の原因がサービスの処理を担当するルータであることが分かった。NTT東が16日に発表した。 NTT東によると、障害の原因は同社ビル内に設置しているIP電送装置(ルータ)が故障し、パッケージを交換したことによるもの。工事でパッケージを交換すると、IP網内にあるすべてのルータにおいて通信経路を決定するルート情報(ルーティングテーブル)の書き換えが自動的に行われるが、このときに、ルータの処理能力を超える情報が発生。ほかの多数のルータにおいても連鎖的に処理能力を超えた書き換えが起こった結果、IPパケットの転送処理が自律的に停止してしま

    NTT東フレッツの広域障害、原因はIPルータの処理能力オーバー
  • 相次ぐシステム障害の真因を追う:ITpro

    全日空輸(ANA)の空港システムで障害が発生し,2008年9月14日の始発便から国内線の一部で欠航や遅延が出た。旅客の予約・搭乗手続きや手荷物を管理するチェックインシステム「able-D」に異常が発生し,国内空港の限定した範囲でチェックイン用端末が利用できなくなった。 全日空のCIO,搭乗システム障害について会見,「担当者の会話が不十分だったためのごく初歩的なミス」と反省の弁 [2008/09/18] [速報]全日空が搭乗システム障害の原因特定,接続の有効期限を設定ミス [2008/09/18] 国交省が全日空に指導,「5・27」の教訓を生かせたか [2008/09/17] 〔続報〕全日空の搭乗システムが暫定復旧,日付処理の問題が濃厚 [2008/09/14] 〔速報〕全日空の国内空港システムで障害,復旧のメド立たず欠航便も [2008/09/14] 東京証券取引所で2008年7月22日

  • 【ANA障害】システム対策に3億円投資、欠航の減収は4億円

    全日空輸(ANA)は5月末の大規模障害を受けて、システムの増強や改善の対策に2億~3億円の資金を投じる。また、欠航による減収は約4億円であることが分かった。6月13日の会見でANAが明らかにした(関連記事)。合計で約7億円となり、ブランド・イメージの低下とともに、大規模障害の影響の大きさを裏付けた。 システムについては、問題となったスイッチ間の経路を2重化から4重化に、ゲートウエイ・サーバーの能力増強、スイッチやサーバーにおけるフェイルセーフ機能の実装など全面的に対策を実施する。これを含めて全体で2億~3億円の投資を見込んでいる。 減収部分の内訳は、5月27日の当日を中心とした旅客の搭乗キャンセルが約4億円だった。このほか、現時点で顧客の利用したタクシーやホテルの代金として4000万~5000万円を拠出している。今後、全国の空港での集計が終わっていないため、額は増える見通しだ。 なお、A

    【ANA障害】システム対策に3億円投資、欠航の減収は4億円
  • 【ANA障害】「引き金」となった大型スイッチにシスコ・NECがコメント

    6月13日夕方、全日空輸(ANA)は5月末の大規模障害について詳細を記者会見で説明した。その中で、一因とされたのがデータセンターの通信機器故障だった。データのパケットを振り分けるスイッチで、「米シスコのCatalystシリーズの大型機」(ANAの担当者)という。IT推進室長の佐藤透執行役員は会見で「NECがシスコ製品を選択して納入した。シスコから世界で同様の問題は4事例しかないと聞いている」と述べた。 この点についてシスコは誌の取材に「当社としてお客様が発表した以上のことはコメントできない」とした上で、世界4例の障害事例については「現在詳細を確認しているところ。ただ、今後このような事が起こらないよう、社内での取り組みを強化したい」と説明する。また、NECは「当社が納入した機器であり、誠に申し訳ないと思っている。ただ、ANAのシステム全体との関係についてはコメントできない」としている。

    【ANA障害】「引き金」となった大型スイッチにシスコ・NECがコメント
  • 【続々報】年金システム障害の原因はミドルウエアのバグ、6年を経て顕在化

    社会保険庁は6月12日、年金システムで先週日曜日に障害が発生した問題について、原因はオンライン・システムを制御するミドルウエアの不具合だったと発表した。障害が発生したのは年金オンライン・システムが稼働する9台のメインフレームのうち3台。10日午前8時30分から最長で2時間半、この3台につながる全国23県合計130の社会保険事務所で端末が起動せず、年金の照会業務ができなかった(関連記事)。 年金オンライン・システムの開発と運用を担当するNTTデータによれば、ミドルウエアの不具合は「01年3月の稼働以来、潜んでいたもの」(広報)という。このミドルウエアは、各事業所がオンライン・システムを何時から何時まで使うかという情報をテーブルで管理する。しかしテーブル領域が不足すると何らかの理由でミドルウエアが起動しない不具合があった。 今回、3台のメインフレームでは、金曜日に延長稼働させ土日も連続運転さ

    【続々報】年金システム障害の原因はミドルウエアのバグ、6年を経て顕在化
  • やりきれない“動かないコンピュータ”

    年金問題に関する報道が連日繰り広げられている。昨日の日経朝刊1面には「年金番号 重複なお2万件」という見出しが躍った。来,公的年金の加入者1人ひとりに割り振られるはずの「基礎年金番号」が同一人物に重複して付けられているケースが,昨年10月時点で2万件も残っていることが明らかになった,というのだ。 ここで,年金問題の解決に向けた今後のシステム化の行方について議論することは,先日の記者のつぶやき『謎が謎を呼ぶ「IT年金問題」』と重複するので控えたい。ただ,この問題で露呈した数々の事実は,企業情報システムの構築・運用や,そのマネジメントにかかわる人々にとって大きな示唆と問題を投げかけていると思うので,この観点から改めて考えてみたいと思う(6月10日に起きた年金システムの障害については関連ニュースを参照)。 「元々が紙データ(非電子データ)であった名前を電子化するということは,とても大変な作業な

    やりきれない“動かないコンピュータ”
  • 「ひかり電話」はまだまだ止まる - ビジネススタイル - nikkei BPnet

    「ひかり電話」はまだまだ止まる (谷島 宣之=「経営とIT」サイト編集長) 交換手を介さずに電話をつなぐ「自動電話交換機」が日で初めて導入されたのは1926年1月のことという。当時は故障が多かったに違いない。それから80年あまり経ち、電話交換機による固定電話サービスは完成の域に到達した。家から固定電話をかけて、つながらなかったという経験をした人はもういないのではないか。 ところがここへ来て、電話がつながらないという事態が相次いで起きている。NTT東日NTT西日の「ひかり電話」故障である。先月でいうと、5月15日から16日、23日、28日にそれぞれ、ひかり電話がつながらないトラブルが発生した。ひかり電話は2006年にも、3月、4月、9月、10月、12月と、つながりにくい状況になっていた。電話が日に上陸して100年以上が経ったが、電話が簡単にはつながらない時代が再びやってきた。

  • NTTのひかり電話障害はコマンド間違いが原因、待機系は稼働せず

    NTT東日NTT西日は5月24日、昨日午前にIP電話サービス「ひかり電話」が両社の間で不通になったトラブルについて詳細を発表した。問題を起こしたのは、両社のひかり電話網をつなぐ中継網内の呼制御サーバー。入札によって、NTT東子会社のNTT-MEが提供している。 NTT-MEは5月21日深夜から22日早朝にかけて、呼制御サーバーのハードディスクを予防的な保全作業で交換。この際に作業員が入力したコマンドに誤りがあり、ハードディスク内の一部データが損壊した。そして23日午前6時25分、損壊したデータが呼制御サーバーのメモリに読み出されダウンしてしまった。 問題となった呼制御サーバーには、待機系のサーバーとハードディスクも用意されていた。ただ、待機系に切り替わるのはサーバーのハードウエア故障の場合で、今回のようなソフトウエアに起因するものはそれ以外のケースとなる。手動で待機系に切り替えること

    NTTのひかり電話障害はコマンド間違いが原因、待機系は稼働せず
  • 3秒で2000ルータがダウン、NTT東フレッツ障害の原因は ― @IT

    2007/05/16 NTT東日の「フレッツサービス」「ひかり電話」が東日の広いエリアで5月15日18時44分から翌日1時35分まで使えなくなった大規模障害の原因が分かってきた。 5月16日に説明会見を開いたNTT東日によると、障害のきっかけは1台のルータの故障。このルータ故障の影響が3秒でNTT東日管内の約4000台のルータに広がり、2000台が機能を停止した。NTT東日の代表取締役副社長 大木一夫氏は顧客に謝罪したうえで、「今回の事象を教訓に次世代ネットワーク(NGN)を安心安全信頼のネットワークにしたい」と語ったが、緊急通報までも利用できなくなった今回の障害で、同社の技術に対して不信感が広がりそうだ。 複合的な要因で処理能力オーバー 障害が発生したのはBフレッツ(約100万契約。うち、ひかり電話契約は約50万)、フレッツ・ADSL(約126万契約)、フレッツ・ISDN(約1