[B! インフラ][障害] t_masudaのブックマーク

t_masuda id:t_masuda

インフラと障害に関するt_masudaのブックマーク (12)

江崎グリコの基幹システム移行トラブルについてまとめてみた - piyolog
2024年4月5日、江崎グリコは基幹システムの切り替え後にシステム障害が発生し、同社や販売委託を受けている一部の冷蔵食品の出荷に影響が生じていると公表しました。ここでは関連する情報をまとめます。障害後緊急対応するも在庫数合わず業務停止今回システム障害が起きたのは江崎グリコの基幹システムで2024年4月3日の新システムへの移行に伴い発生した。物流、販売、会計などを一元管理するERPパッケージ SAP社製「SAP S/4HANA」で構築されており、「顧客への継続的価値創出を可能にするバリューチェーン構築と経営の迅速な意思決定を目的とした、調達・生産・物流・ファイナンスなどの情報を統合する基幹システム」と同社では説明している。障害原因の詳細は同社から開示されてはいないが、システム障害の問題個所の特定は済んでいる。なおサイバー攻撃によるものではないと取材に答えている。*1 システム障害の影響に
t_masuda 2024/07/06
仕事

インフラ

障害
リンク
「au通信障害」KDDI髙橋社長の会見質疑詳報、なにが起きたのか、「ドコモの教訓」は？
t_masuda 2022/07/04
仕事

インフラ

障害

技術

ネットワーク
リンク
KDDIの通信障害についてまとめてみた - piyolog
2022年7月2日、設備障害によりKDDIの携帯電話サービスで障害が発生しました。ここでは通信障害に関連する情報をまとめます。通信障害発生から復旧発表まで3日以上 au携帯電話サービスがご利用しづらい状況について障害発生同日8時以降から1時間おきに障害報告が公表されていた。障害発生・復旧の状況は以下の通り。対象地域障害発生日時復旧作業終了時間復旧完了日時西日本 2022年7月2日 1時35分頃 2022年7月3日 11時頃 2022年7月5日15時36分東日本 2022年7月2日 1時35分頃 2022年7月3日 17時30分頃 2022年7月5日15時36分影響を受けたのは全国の個人・法人向けのau携帯電話、UQ mobile携帯電話、povo、au回線利用事業者の音声通信、ホームプラス電話、ホーム電話、auフェムトセル、SMS送受信。7月3日11時時点の概算では約3
t_masuda 2022/07/03
仕事

インフラ

障害
リンク
一部のお客様へ影響しているアトラシアンサービスの停止について | Atlassian Japan 公式ブログ | アトラシアン株式会社
本ブログは、こちらに掲載されている英文ブログの意訳です。万が一内容に相違がある場合は、原文が優先されます。 2022年4月18日 23:57 UTC時点で、サービス停止の影響を受けたお客様サイトの復旧を完了しました。 2022年4月4日(月) PTに、アトラシアンクラウドをご利用の約400社のお客様が、アトラシアン製品全体を通してサービスの停止を経験されました。2022年4月18日現在、影響のあったお客様サイトの復旧を完了し、各サイトの窓口ご担当者宛てにご連絡申し上げました。当社のサポートチームは現在、個々のお客様に合わせたサイト特有のニーズに対応しています。支援を必要とする事象のあるお客様は、当該サポートチケットへその旨ご返信ください。至急エンジニアリングチームより対応させていただきます。今回のインシデントはサイバー攻撃や、システムの拡張に問題があったものではありません。また、一部の
t_masuda 2022/04/13
障害

インフラ

仕事
リンク
スーパーコンピュータシステムのファイル消失のお詫び | お知らせ | 京都大学情報環境機構
京都大学学術情報メディアセンターセンター長岡部寿男 2021年12月14日 17時32分から 2021年12月16日 12時43分にかけて,スーパーコンピュータシステムのストレージをバックアップするプログラム(日本ヒューレット・パッカード合同会社製)の不具合により,スーパーコンピュータシステムの大容量ストレージ(/LARGE0) の一部データを意図せず削除する事故が発生しました. 皆さまに大変なご迷惑をおかけすることになり,深くお詫び申し上げます. 今後,再びこのような事態の生じることのないよう再発防止に取り組む所存ですので,ご理解をいただきますよう,どうぞよろしくお願いいたします. ファイル消失の影響範囲・対象ファイルシステム: /LARGE0 ・ファイル削除期間:2021年12月14日 17時32分～ 2021年12月16日 12時43分・消失対象ファイル:2021年12
t_masuda 2021/12/29
障害

インフラ
リンク
Understanding how Facebook disappeared from the Internet
Understanding how Facebook disappeared from the Internet10/04/2021 This post is also available in 简体中文, 繁體中文, 日本語, 한국어, Deutsch, Français, Español, Português, Pусский, and Italiano. The Internet - A Network of Networks“Facebook can't be down, can it?”, we thought, for a second. Today at 15:51 UTC, we opened an internal incident entitled "Facebook DNS lookup returning SERVFAIL" because we were worr
t_masuda 2021/10/05
仕事

DNS

ネットワーク

インフラ

障害
リンク
Summary of AWS Direct Connect Event in the Tokyo (AP-NORTHEAST-1) Region
日本時間 2021 年 9 月 2 日に東京リージョン（AP-NORTHEAST-1）で発生した AWS Direct Connect サービスの中断に関する追加情報を提供いたします。午前 7 時 30 分(以下すべて日本時間)から、Direct Connect をご利用中のお客様は東京リージョンに向かうトラフィックについて断続的な接続の問題とパケットロスの増加を観測し始めました。この事象は、Direct Connect ロケーションから、顧客の Virtual Private Cloud（VPC）が存在する東京リージョンのデータセンターネットワークへのネットワークパスに沿ったネットワークレイヤーの 1 つでネットワークデバイスの一部に障害が発生したことが原因です。お客様は午後 12 時 30 分に復旧を観測しはじめ、午後 1 時 42 分に接続の問題は完全に解決されました。アベイラビリ
t_masuda 2021/09/08
障害

aws

仕事

インフラ
リンク
fastlyのCDNで発生したシステム障害についてまとめてみた - piyolog
2021年6月8日、fastlyのCDNサービスで障害が発生し、国内外複数のWebサイトやサービスに接続できないなどといった事象が発生しました。ここでは関連する情報をまとめます。原因はソフトウェアの潜在的な不具合 fastlyより6月8日付で今回の障害の顛末が公開されている。 www.fastly.com 障害原因はソフトウェアの潜在的な不具合で特定状況下かつ顧客構成で発生する可能性があった。このソフトウェアは5月12日に展開が開始されていた。 6月8日早くにこの不具合を発生条件を満たす構成変更が顧客によって行われネットワークの85%がエラーを返す事態が発生した。サイバー攻撃の可能性は否定と報じられている。*1 障害は発生から1分後にfastlyに検知され、49分以内にネットワークの95%が復旧した。今回の障害を受け、短期的には修正プログラムの早期適用、復旧時間の短縮、テスト時に不具合
t_masuda 2021/06/09
CDN

仕事

インフラ

障害
リンク
東証、障害の原因を特定　設定値に不備、切り替え失敗
日本取引所グループは同日、調査結果を踏まえ、再発防止策などを検討する調査委員会を設置した。委員長の久保利英明弁護士をはじめ、4人の社外取締役で構成する。関連記事東証、10月2日は通常通りの売買へシステム障害を起こし全銘柄の売買を停止していた東京証券取引所は、明日、10月2日は通常通り売買を行うと発表した。東証のシステム障害、解消は「明日以降」　「バックアップへの切り替え」で異常東京証券取引所が、システム障害について「明日以降、正常な売買ができるよう対応している」と発表した。東証にシステム障害　終日、全銘柄売買停止に【更新】東京証券取引所は10月1日、相場情報に障害が発生したため、朝から全銘柄の売買を停止している。1日は終日売買停止となる。復旧については未定。 “東証を変えた男”が語る、金融業界の伝説「arrowhead」誕生の舞台裏――“決して落としてはならないシステム”がで
t_masuda 2020/10/06
仕事

障害

インフラ
リンク
2020年10月に発生した東京証券取引所のシステム障害についてまとめてみた - piyolog
2020年10月1日、東京証券取引所はアローヘッドの機器故障によりシステム障害が発生し、終日売買を停止すると発表しました。故障した機器は交換が行われ、取引は翌日再開されています。ここでは関連する情報をまとめます。機器故障起きるも縮退運用に失敗障害概要図アローヘッド内の共有ディスク装置1号機で機器故障が発生した。実際故障したのはサーバー上のメモリ周辺機器とされる。 1号機故障により両現用で稼働していた2号機のみのフェールオーバー（縮退運用）が行われるはずだったが何らかの問題により行われなかった。共有ディスク装置を使用する相場配信、売買監視のシステムで障害が発生。障害復旧時に発生する注文データ消失による市場混乱を避けるため当日終日の取引停止の措置を実施。（遮断）フェールオーバー失敗原因は設定ミスフェールオーバーに失敗した理由が特定できたとして10月5日に発表。障害発生時のフェー
t_masuda 2020/10/02
仕事

インフラ

障害
リンク
AWS障害、“マルチAZ”なら大丈夫だったのか？　インフラエンジニアたちはどう捉えたか、生の声で分かった「実情」
AWS障害、“マルチAZ”なら大丈夫だったのか？　インフラエンジニアたちはどう捉えたか、生の声で分かった「実情」（1/3 ページ） 8月23日に起きたクラウドサービス「AWS」（Amazon Web Services）の東京リージョンでの障害は、国内のさまざまなサービスに影響を及ぼした。 AWSが同日午後8時ごろに復旧するまで、モバイル決済サービス「PayPay」や、仮想通貨取引所「Zaif」、オンラインゲーム「アズールレーン」などで利用できない、もしくは利用しづらい状況が続いた。PCショップの「ドスパラ」はECサイトの不具合が長引き、翌日の24日には実店舗を臨時休業して対応に当たっていた。 AWSという1つのサービス障害が起きただけで、多くの企業やサービスに影響を及ぼしたため、「クラウドサービスはもろい」という論調も散見された。しかし、インフラエンジニアたちからは違う意見が聞こえてくる
t_masuda 2019/08/29
aws

障害

インフラ

仕事
リンク
AWS 東京リージョンで発生した大規模障害についてまとめてみた - piyolog
2019年8月23日 13時頃からAmazon AWS 東京リージョンでシステム障害が発生し、EC2インスタンスに接続できない等の影響が発生しています。ここでは関連する情報をまとめます。 AWSの障害報告 aws.amazon.com AWS障害の状況障害発生時間（EC２）約６時間 2019年8月23日 12時36分頃～18時30分頃（大部分の復旧）障害発生時間（RDS）約９時間半 2019年8月23日 12時36分頃～22時5分頃障害原因（EC２）一部EC2サーバーのオーバーヒートによる停止制御システム障害により冷却システムが故障したことに起因影響範囲東京リージョン（AP-NORTHEAST-1）の単一のAZに存在する一部EC2、EBS、およびRDS。発生リージョンは東京。東京近郊４データセンター群の内、1つで発生。日本国内のAWSの契約先は数十万件とみられる。*
t_masuda 2019/08/24
インフラ

aws

障害

仕事
リンク
1