Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
しわっす!DBA 兼オペレーションエンジニア兼タスクマネージャやってる riywo です。何のネタを書こうかなぁと考えたのですが、正直ネタを仕込む時間もなかったので僕がいつもやってることをさらっと紹介するということで勘弁して下さい>< MySQL がおかしい! 03:14 hidek: なんかエラー出まくってるんだけど! 03:14 zigorou: MySQL と通信してるとこっぽい 03:15 riywo: 見ます こんなやりとりは皆さん日常茶飯事ですよね?ね?ね?こんな時に、DB に責任を持つものとして真っ先に対応するのが僕らの仕事です。でも、じゃあ具体的にこのあと何をしましょう?既にサービスはエラーだらけで一刻を争う状態です。 (対応開始) まずはエラーメッセージ 今回の様な場合はアプリのエラーログにどばっと MySQL に関するエラーが出ているでしょう。まずはそれを見ることが始ま
4月21日に発生したAmazonクラウドの米国東海岸データセンターで起こった大規模障害により、Foursquare、Quora、Herokuなど多くのサービスに影響がありました。 すでに障害は復旧し、Amazonクラウドの運営チームからは詳細な報告と今後の対応策について記したドキュメント「Summary of the Amazon EC2 and Amazon RDS Service Disruption in the US East Region」が公開されています。公式な日本語訳「 米国東リージョンにおける Amazon EC2 と Amazon RDS のサービス障害 の概要 (参考和訳)」(pdf)も公開されました。 これによると、障害はネットワークの構成を間違えたことをきっかけにして、ストレージサービスの「Amazon Elastic Block Store(EBS)」やデータベ
北バージニアリージョンのEBSへの膨大な再ミラーリングが原因のトラブルは、1つのAvailability Zoneを除いてほぼ復旧したが、HootSuiteやAbout.meなど多くの顧客サイトはまだ機能していない。 4月21日の深夜(現地時間)に発生した米Amazon Web Services(AWS)のトラブルは、同日の午後2時(日本の22日午前6時)現在もまだ解消しておらず、同サービスを利用しているQuora、HootSuite、About.meなどの多数のサービスはダウンしたままだ(foursquareは復旧している)。 AWSのAmazon Web Services Service Health Dashboardによると、トラブルが発生したのは北バージニアのデータセンターで提供する「Elastic Compute Cloud(EC2)」「Amazon CloudWatch」「A
Gmailで電子メールなどが消える障害が起きているとGoogleが報告した。現在調査中という。 米国時間27日から、複数のユーザーがGmailのメッセージやアドレス帳などが消えたとネットで報告していた。Googleのユーザーフォーラムには、電子メール、アドレス帳、設定、ラベル、フォルダがすべて消えたといった書き込みが投稿されている。 Googleによると、この問題はGmailユーザーの0.29%に影響している。同社は現在もまだ問題を調査中で、消えたメールなどのデータをできるだけ早急に復旧できるよう取り組んでいるとしている。 10時15分追記:Googleは影響を受けているユーザーの割合を0.08%に修正。Googleの修復作業中、これらユーザーは一時的にログインできなくなる可能性があるとしている。 19時55分追記:Googleは、一部ユーザーについてはサービスが復旧したと報告している。
Google App Engineダウンの原因はデータセンターの電源故障。さらに復旧手順のミスが重なった 米国時間の2月24日、グーグルが提供するGoogle App Engineのデータストアが障害により停止するという事故が発生しました。この事故の状況については、そのときの記事「Google App Engineが昨夜ダウン。障害がごく一部に残り、対応チームは現在も作業中」」で詳しく報じました。 それから2週間、グーグルが原因と対策について書いたドキュメントをGoogle Groupに「Post-mortem for February 24th, 2010 outage - Google App Engine | Google Groups」というメッセージとしてポストされました。 原因はデータセンターの電源障害 グーグルの解説によると、今回の障害の直接の原因はプライマリデータセンターの
グーグルは1月6日、Google App EngineのデータストアとしてPaxos algorithmによるデータセンター間のデータ同期を採用し、可用性を大幅に向上させた新データストア「High Replication Datastore」を追加したと、ブログのエントリ「App Engine 1.4.1 をリリースしました - High Replication Datastore の紹介」で明らかにしました。 App Engine 1.4.1 をリリースしました - High Replication Datastore の紹介 - Google Japan Developer Relations Blog 複数のデータセンターにまたがったレプリケーションを行うことで、特定のデータセンターに障害が発生した場合でもほとんどの場合で問題なく動作するとのことです。 可用性は高まるが書き込みは遅く
ヤフー(以下、Yahoo! JAPAN)ならびにディー・エヌ・エー(以下、DeNA)は、試験提供している「Yahoo!モバゲーβ版」において障害があったことを発表した。 発表によると、2010年9月22日12時50分から9月23日21時30分までの間、DeNAが運営するPCサービス「Yahoo!モバゲーβ版」に対象となるユーザーのモバゲーIDに紐づくページ(マイページを含む)について、一時的に他のユーザーがアクセスできる状態となっていたとのこと。単体では個人が特定できない情報ではあったものの、性別や地域などの一部の登録情報の閲覧やその他の利用ができる可能性があったとのこと。なお発表時点でこの事象が発生したと確認されているユーザーは10名。現時点で登録情報の不正利用などの事実は確認されておらず、また、「Yahoo! JAPAN」IDの取得時に登録された情報や決済情報の流出はないとしている。
10月13日深夜から10月14日にかけて起きたポータルサイト「Yahoo!Japan」のアクセス障害について、ヤフーはCNET Japanの電話取材に応じ、原因を説明した。 Yahoo!Japanでは、10月13日午後11時33分から10月14日午前0時56分の約1時間半の間にアクセスした際、サイトが表示されない、もしくはサイトの一部が表示されても画像が表示されないという障害が発生していた。 ヤフーによると、原因は負荷分散用サーバの一部に物理障害が起きたためだという。「同時期に他社でもアクセス障害があったようだが、調査したところ外部からの攻撃は認められなかった」(ヤフー)。その後、同社では14日1時から約2時間、トップページにてアクセス障害についての謝罪文を掲載していた。今後は広告主などにむけて、個別に状況を説明するとしている。
Facebookは米国時間9月23日、同社サイトが同日、約2時間半にわたり不安定な状態に陥っていたことを認め、同社APIの「レイテンシ問題」に遭遇していたことを明らかにした。 同社は9月24日付の声明で、今回の障害が4年間で最悪のものだったとした上で、原因は設定に加えた変更が無効な値と判断され、その無効な値を修正する膨大な数のクエリがデータベースクラスタへと殺到し、結果としてクラスタに負荷がかかりすぎたためとしている。 「われわれはフィードバックループに陥り、データベースを回復することができなかった。このフィードバックサイクルを止めるのは非常に困難で、このデータベースクラスタへのすべてのトラフィックを止める必要があった。つまり、サイトをダウンさせるということだ。データベースが回復し、根本の原因が修正されたため、サイトをゆっくりと復帰することができた」(Facebook声明)
SNS「mixi」が8月10日からアクセスしづらくなっている問題で、12日午前0時30分ごろ、mixiトップページとミクシィコーポレートサイトに、笠原健治社長の名でコメントが発表された。 コメントによると、障害の原因は「mixiのキャッシュサーバーの負荷が高まった際に、一定の条件で異常な動作を示すこと」。不具合解消に向け、「利用できるユーザー数を調整しながら復旧作業を行っている」という。 完全復旧にはまでは「今しばらく時間を頂くことになると思われる」とし、「皆様に多大なるご迷惑をおかけしまして、大変申し訳ございません」とわびている。 mixiは、PC版・携帯版とも10日午後5時20分ごろからアクセスしづらい状態に。同日午後11時30分ごろに一時復旧したが不安定な状態が続き、11日午前11時20分ごろ再びダウン。12日午前1時現在、不安定な状態が続いている。 12日午前9時30分追記 mix
SNS「mixi」が、8月10日午後5時20分ごろからアクセスしづらい状態になっている。運営元のミクシィは原因を明らかにしておらず、午後6時45分現在、復旧のめども立っていないという。障害によるユーザーデータへの影響はないとしている。 PC版トップページにアクセスすると、「復旧作業をおこなっております。申し訳ございませんが、しばらく時間をおいてから再度アクセスをお試しください」と表示。携帯版にも同様なメッセージが表示されている。 11日午前0時更新 ミクシィの原田明典COOは10日午後11時50分ごろTwitterで、「まだ暫定的だが、100%のユーザーのアクセスを復旧した」とコメント。編集部でmixiにアクセスしてみたところ、PC、モバイルともアクセスできることを確認したが、使えない機能があるなど不安定な状態が続いているようだ。 mixiのユーザーページでは、ボイスに加えて日記に「イイネ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く