タグ

関連タグで絞り込む (161)

タグの絞り込みを解除

障害に関するlocke-009のブックマーク (161)

  • 先週のサイバー事件簿 - NTT東日本の通信サービス障害、原因は未知の不具合

    5月8日週にかけて発生したセキュリティに関する出来事や、サイバー事件をダイジェストでお届け。 NTT東日、通信サービス障害の調査結果を公開 東日電信電話(NTT東日)は、2023年4月3日に発生した通信障害についての調査結果を公開した。この通信障害は、2023年4月3日午前7時10分~午前10時08分にかけて発生。北海道、東京都、神奈川県、埼玉県、千葉県、新潟県において、一部顧客の光アクセスサービス・ひかり電話などが利用できない、または利用しづらい状態となった。影響を受けたのは、最大で35.9万回線(うち、ひかり電話が最大18.6万回線)におよぶ。 原因は、加入者収容装置の特定機種においてソフトウェアに不具合が存在し、一定の条件が重なると動作不良が発生するというもの。具体的には、マルチキャスト受信において加入者収容装置(パケット転送部)が再起動を繰り返す。マルチキャスト通信の不具合は

    先週のサイバー事件簿 - NTT東日本の通信サービス障害、原因は未知の不具合
  • 富士通Japan、コンビニ交付でまた不具合 抹消したはずの印鑑登録証明書を誤発行

    新潟市は5月15日、マイナンバーカードを利用した証明書のコンビニ交付サービスで不具合が起きたと発表した。抹消済みの印鑑登録証明書を誤交付する不具合が発生し、市は交付サービスの提供を一時全面停止にした。システムの提供事業者は富士通Japan。 12日昼ごろ、住民から「既に廃印処理済である印鑑登録証明書を誤交付された」の指摘を受け、不具合が発覚。市はコンビニ交付システムの提供を全面停止した。その後、原因を特定したところ、他の証明書では不具合が発生しないと判明。同日中に該当する証明以外の交付を再開、16日には印鑑登録証明書の交付も再び始めた。 この件について、富士通Japanが追跡調査を行ったところ、新潟市の他住民で同じ現象が2件起きていることを確認。また、他自治体での影響を調べたところ、一部の政令指定都市でも同様の事象が発生する可能性があると明らかに。該当の自治体にはそれぞれ連絡したという。

    富士通Japan、コンビニ交付でまた不具合 抹消したはずの印鑑登録証明書を誤発行
  • 相次ぐ住民票誤交付トラブル、富士通Japanのシステムに何が起こっているのか

    コンビニの証明書交付サービスで住民票の写しを取得しようとしたら他人のものが出てきたーー。2023年3月以降、同様のトラブルが横浜市や東京都足立区、川崎市で相次ぎ発覚し、注目を集めている。開発元はいずれも富士通Japanだ。 最初に発覚したのは横浜市だった。2023年3月27日昼ごろ、磯子区役所に誤発行の報告が寄せられると、青葉区役所や横浜市のマイナンバー専用コールセンターなどにも同様の連絡が相次いだ。最終的に同市で誤発行したのは、住民票の写し6件(12人分)、住民票記載事項証明書2件(4人分)、印鑑登録証明書2件(2人分)の計10件(18人分)である。このうち、1件はマイナンバー入りの住民票の写しだったことが判明し、個人番号の変更まで余儀なくされた。 続いて発覚したのは東京都足立区だ。富士通Japanが横浜市でのトラブル後、コンビニ交付サービスを利用する他の自治体について調べたところ、トラ

    相次ぐ住民票誤交付トラブル、富士通Japanのシステムに何が起こっているのか
  • 発達障害児の親を6年やってみて

    子供が二人いるが上の子が発達障害だ(検査済、療育通うが手帳持ちではない) 家の場合は3歳の時に保育園から町の療育センター行けと言われ何回か通った後に医師による診察を経て発達障害と診断された。その後大きい病院に半年周期で経過観察しつつ普通に保育園に通っているが来年は小学校で正直どうなるかは未定。 モンテッソーリ教育とかしている園だったらすんなり受け入れられるだろうが大半の幼保園は難色を示してくる。特に人員が少なかったりする園は遠回しじゃない言い方で転園を進めてきたりする。儲けが変わらないので言うこと聞く手のかからない子を多く受け持ちたいのだと思う。下の子も発達障害では無いが身体の成長が少し遅いため上の子とは別の園に半ば強制的に変更させられた。 他の園での対応とか見ていると上の子が今も通っている保育園が異常だとなんとなく思うようになったが、上の子の診断を受けた時は正直絶望した。幸いがアンミカ

    発達障害児の親を6年やってみて
  • ANAのDB障害の裏に「危うい常態」、パッチは全て当てるべきなのか

    全日空輸(ANA)で2023年4月3日に発生したシステム障害は、50便以上が欠航するなど利用客に大きな影響を与えた。ANAが4月7日に開いた記者会見によると、データベースに「予期せぬエラーが発生」し、「フリーズ」状態になったのが原因だという。 エラーの発生はデータベースのバグに起因するもので、それを是正するパッチ(修正プログラム)は既に提供されていた。日経クロステックの記事によれば「同社はシステム構成上パッチ未適用でも問題ないとみて適用を見送っていた」という。 なぜパッチは適用されなかったのかを考えてみたい。 運用で回避しきれるか ANAのデータベースが抱えていたバグは、パラレルクエリーに関するものだ。パラレルクエリーはSQLを並列化して実行し、照会処理のパフォーマンスを向上させる機能である。同社の資料では「複数のデータ抽出処理を並列で同時に実行することによるデータベースの偶発的なエラー

    ANAのDB障害の裏に「危うい常態」、パッチは全て当てるべきなのか
  • NTT東西の「フレッツ光」大規模障害、原因は特定のサーバから届いた“特殊なパケット”だった

    4月3日の午前中に発生した「フレッツ光」と「ひかり電話」の障害ではNTT東日NTT西日を合わせて最大約44万6000件に影響が出た。原因は新しい加入者装置に特殊なパケットが届いたこと。ただし「アタックである可能性は限りなく低い」としている。 障害が発生したのは午前7時10分ごろ。複数のNTT局舎内にある加入者収容装置が特殊なパケットを受信後にリブートした。フェイルオーバー機能が働き、自動的に別の装置に切り替わったものの、そちらも同じ障害が発生した。 NTT東では49拠点89台、NTT西は21拠点27台の加入者収容装置で同時に障害が発生し、ネット接続サービスの「フレッツ光」と光回線を使う電話サービス「ひかり電話」が一時つながりにくい状態になった。ひかり電話は緊急通報にも支障をきたし、消防庁が公式Twitterアカウントで「携帯電話や公衆電話の利用、消防への直接駆け込み」を促すツイートを

    NTT東西の「フレッツ光」大規模障害、原因は特定のサーバから届いた“特殊なパケット”だった
  • 【10分で確認】インフラ起因のシステム障害で焦らないための監視系コマンド集 - Qiita

    はじめに ベンチャー企業や立ち上がって間もない開発組織の場合、事業の成長スピードに対して、インフラ/SREエンジニアへのリソース不足が発生します。 スピード重視の結果、監視設計が不十分なままプロダクトがリリースされることも少なくないため、インフラに強いベテランの方のみが障害対応に当たらざるを得ず、周囲はただ応援するといった形もあるのではないでしょうか。 いざというとき、「アプリケーション起因じゃなければ、私は何もわからない...」とならないために、非インフラ/SREエンジニアでも最低限覚えておきたい障害発生時に役立つ監視系のコマンドをまとめてみようと思います。 記事で想定している読者は以下の通りです。 インフラ関連の障害時に、問題の切り分けを行うためのコマンドが知りたい人 監視系コマンドを実行できる環境構築をサクッと作って動かしながら学びたい人 非インフラ/SREエンジニアでインフラ起因

    【10分で確認】インフラ起因のシステム障害で焦らないための監視系コマンド集 - Qiita
  • Twitter、サード製アプリ締め出しで自分が落ちる「現在のプランではアクセスできません」エラー表示 | テクノエッジ TechnoEdge

    時間の3月7日未明、Twitter でリンクが開けない・画像が読み込めない等の不具合が発生しました。 障害が継続したのは数時間。完全にログインできないわけではなく、機能が落ちた状態でツイートは可能だったため、地域によってはトレンドがTwitter Down や Twitter API等で埋まる事態になりました。 復旧:Twitterのタイムラインが停止する不具合発生中、「フォロー中」が「ようこそ」表示に。更新止まった報告多数 | テクノエッジ TechnoEdge Twitter2023年に入ってからだけでも数回の不具合やサービス停止を繰り返していますが、今回の障害が斬新だったのは、ユーザーがリンクを開こうとすると「your current API plan does not include access to this endpoint」といったエラーメッセージが表示されたこと。

    Twitter、サード製アプリ締め出しで自分が落ちる「現在のプランではアクセスできません」エラー表示 | テクノエッジ TechnoEdge
  • 障害対応は寝て、食べるが大事 - Qiita

    「 障害対応 」 エンジニアができるだけ見たくない単語ですね。 でも人間が作っているシステムである以上おそらく避けては通れない道... 実は直近で障害対応を経験し、正直すごくしんどい思いをしました。 今回はその教訓を記事に起こしたいと思います。 障害&起こったこと 2月某日クライアントから障害報告が来ました。 幸い既に障害原因箇所が今後は動かないコードの部分だったのでシステム自体の改修はありませんでした。 ですが、障害報告として対象データの洗い出しを行う必要がありました。 結構対象データの件数もあったのですが、粛々と対象しないといけないです。 一通り調査し、報告したところ トラブル発生 ... 調査結果に不備が見つかってしまいました。。。。 障害が起きている時点でクライアントは結構噴火寸前。 もちろん厳しいお言葉をいただきました。。。。 その後も続く調査&報告....そして厳しいお言葉の数

    障害対応は寝て、食べるが大事 - Qiita
  • マイクロソフト、1月25日に発生した大規模障害の原因を説明

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Microsoftは、米国時間1月25日に同社のWANに発生した大規模障害に関する詳細を公表した。この障害では、世界中の顧客が「Azure」や「Microsoft 365」、「Power Platform」などのサービスにアクセスできなくなった。 影響が数時間に及んだ今回の障害では、「Microsoft Teams」「Exchange Online」「Outlook」「SharePoint Online」「OneDrive for Business」「Microsoft Graph」「Power BI」「Microsoft 365 Admin Portal」「Microsoft Intune」「Microsoft Defender fo

    マイクロソフト、1月25日に発生した大規模障害の原因を説明
  • Skeb、12月の大規模障害は「Heroku障害ではない」「完全に解決」 詳細は触れず

    クリエイターに有償でイラストなどを発注できるサービス「Skeb」を提供するスケブ(東京都千代田区)は1月23日、2022年12月に発生した障害について「セールスフォース・ジャパン担当者との協議を経て、完全に解決した」と発表した。原因がクラウドサービス「Heroku」の障害でないことを確認したという。 Skebでは12月23日から24日にかけて障害が発生。当時の発表では、原因はHerokuのアカウントにあったとしていた。ただし詳細に不明点があり、解決後も問題の経緯を探っていたという。 スケブによれば、セールスフォース・ジャパンは障害の解決後、12月28日にスケブを訪問。原因がHerokuの障害ではないことを確認した他、セールスフォース・ジャパンが当時把握していた状況について説明を受けたという。その後協議を経て、1月23日に問題の解決に至ったとしている。ただし障害が起きた実際の原因については説

    Skeb、12月の大規模障害は「Heroku障害ではない」「完全に解決」 詳細は触れず
  • 2023年のWebアクセシビリティ | gihyo.jp

    あけましておめでとうございます。株式会社ミツエーリンクスの中村直樹です。昨年と同じく、2022年のWebアクセシビリティに関連する出来事を振り返りつつ、2023年のWebアクセシビリティの展望について俯瞰していきたいと思います。 WCAG 2.2 2022年9月版のWCAG 2.2で、文書のステータスとしてはようやく勧告候補(Candidate Recommendation)にまでたどり着き、仕様文書として完成する勧告(Recommendation)が見えてきた…と思っていたところですが、12月になって達成基準4.1.1構文解析を削除するという話が急浮上してきました。 達成基準4.1.1がどういったものなのか、改めて振り返ってみましょう。この達成基準については、もとはWCAG 2.1(原文、参考日語訳)と同じものであり、WCAG 2.0とも同一です。達成基準4.1.1は、マークアップ言語

    2023年のWebアクセシビリティ | gihyo.jp
  • 【1月23日追記】12月23日、24日に発生しました障害に関するご報告

    いつもSkebをご利用いただき、誠にありがとうございます。 12月23日12時よりskeb.jpにアクセスできない大規模な障害が発生しておりましたが、12月24日07時に復旧いたしました。 12月23日、および12月24日が納品期限のリクエストは納品期限を12月25日23時59分までに延長させていただきます。 みなさまには多大なご迷惑をお掛けしましたことをお詫び申し上げます。 障害につきまして詳細をご報告させていただきます。 概要日時: 12月23日12時22分〜12月24日7時00分 (JST) ダウンタイム: 18時間38分 内容: skeb.jpにアクセスできない不具合 原因: SkebはすべてのサーバとシステムをHerokuに設置していたが、障害発生時刻より同サービスのアカウントが理由の通知なく利用できなくなった。 解決: Herokuの一切の利用を中止し、すべてのサーバとシステ

  • AWSで障害に強いシステムを構築する方法 - Qiita

    はじめに 2011年の東日大震災、これから来ると言われる南海トラフ地震などの大規模な災害や事故に備えるために、災害復旧(DR)が可能なシステムと、その実現手段としてAWSを始めとしたクラウドが長年注目されています。 このDRに関連して、近年「レジリエンス」という言葉が注目を集めるようになりました。 レジリエンスとは、回復力、復元力、弾力などの意味を持つ英単語IT分野では、情報システムがシステム障害や災害、サイバー攻撃などの問題に直面したとき、迅速に被害からの回復を図り正常な状態に復旧・復元する能力(の大きさ)をこのように呼ぶ。 https://e-words.jp/w/%E3%83%AC%E3%82%B8%E3%83%AA%E3%82%A8%E3%83%B3%E3%82%B9.html AWSでは、2019年8月に大規模障害が発生したことがあり、この時もAZ障害が起きた時に取り得る対策

    AWSで障害に強いシステムを構築する方法 - Qiita
  • うるう秒、2035年までに廃止へ

    原子時計を地球の自転に合わせるために半世紀にわたって用いられてきた「うるう秒」が段階的に廃止される。こうした調整の技術的リスクを懸念するテクノロジー大手にとっては、うれしい話だ。 時間の管理に携わる世界各国の当局が現地時間11月18日、国際度量衡局(BIPM)の会議で、うるう秒の利用停止を投票で決めた。 BIPMは、うるう秒廃止の理由について、「うるう秒の採用によって生じる不連続が、衛星ナビゲーションシステムや通信、エネルギー伝送など重要なデジタルインフラに深刻な誤動作をもたらすリスクがある」と述べている。 変更は2035年までに実施される予定だ。新たな方針は、今後100年以上使えるように策定されている。 これほど正確な時間管理は、難解な科学の領域のように思えるかもしれないが、コンピューターがタスクを常時追跡し、適切な順番で動作するようにしなければならないデジタル時代には、極めて重要なこと

    うるう秒、2035年までに廃止へ
  • みずほ銀行のトラブルに学ぶ5つの教訓 - Qiita

    TIS株式会社の資料より 前記4つの方法はそれぞれ一長一短がありますが、一番失敗が多いのはリビルドになります。これは筆者の感想ではありません(参考:失敗しないレガシー・マイグレーション)。ですから、まずリプレースが可能か判断して、できなければリホスト、さらにできなければリライト、最後にリビルドを試していくのが順番でしょう。しかしプログラミング言語の変更はハードルが高いです。 そもそもCOBOL言語はALGOL系(ALGOL,C,Java...)の言語と非常に相性が悪いです。COBOLで最適化された設計というのは、ALGOL系では良い設計とはなりません。またCOBOLとオブジェクト指向との相性も良くありません。COBOLではデータと手続きは厳密に分離されています。1つの手続きが複数のデータを次から次へ処理するのがCOBOLの発想です。逆に一つのデータを複数の手続き(プログラム)で処理すること

    みずほ銀行のトラブルに学ぶ5つの教訓 - Qiita
  • ランサムウエア起因による大阪急性期・総合医療センターのシステム障害についてまとめてみた - piyolog

    2022年10月31日、大阪急性期・総合医療センターは電子カルテシステムの障害発生により、緊急以外の手術や外来診療を停止していると公表しました。障害はランサムウエア攻撃が原因と病院は明らかにしています。ここでは関連する情報をまとめます。 障害影響で通常診療が一時停止 システム障害が発生したのは、大阪府立病院機構 大阪急性期・総合医療センター。大阪市の総合病院で診療科36、病床数865床。高度救命救急センター、地域がん診療連携拠点病院にも指定されている。 ランサムウエアによる実被害及び被害拡大防止措置による影響を受け2022年10月31日20時時点で電子カルテシステム及び関連するネットワークが完全に停止中。そのため、同センター内で電子カルテが閲覧できない状況となった。*1 障害の影響を受け、緊急的対応を要するものを除いた、外来診療、予定手術、新規救急受入の一時的な停止を行っている。システム障

    ランサムウエア起因による大阪急性期・総合医療センターのシステム障害についてまとめてみた - piyolog
  • サーバダウンしたニコニコ漫画に何が起きていたのか - BOOK☆WALKER inside

    こんにちは。メディアサービス開発部Webアプリケーション開発課の奥川です。ニコニコ漫画のバックエンド開発を担当しています。 2021年初頭、ニコニコ漫画である作品の連載が開始されました。それに端を発する数カ月間のサーバ障害により、ユーザーの皆様には大変ご迷惑をおかけしました。 少し前の話にはなりますが、当時ニコニコ漫画のサーバでは何が起こっていたのか、どのような対応を行ったのかを振り返ってみたいと思います。 1号棟(事の起こり) 2021/01/08 問題の作品(以後、「作品I」*1と記述します)の第1話が投稿されます。その過激な内容からSNSなどでは一部で話題になりましたが、まだニコニコ漫画へのアクセスも穏やかなものでした。 2021/01/22 その2週間後、「第2話(前編)」の公開から事件が起こります。 ピークタイム最中の12:22頃から、まずmemcachedがCPU Utiliz

    サーバダウンしたニコニコ漫画に何が起きていたのか - BOOK☆WALKER inside
  • KDDI通信障害の報告書で見えた地獄絵図、痛恨のミスから次々と事態が悪化

    総務省の有識者会議「電気通信事故検証会議」は2022年10月5日、KDDIが7月に起こした大規模通信障害に関する検証報告書を公表した。KDDI自身がこれまで4度にわたって記者会見を開いて説明しているので全体像は把握していたが、さらに深掘りした興味深い内容となっている。 例えば障害の影響が全国に波及した点。同業他社からは「KDDIはなぜ影響を局所化できなかったのだろうか」と疑問の声が上がっていた。原因は、同社が音声通話用の「VoLTE(Voice over LTE)交換機」のネットワークをフルメッシュ構成にしていたためだった。東西でネットワークを分けるのが一般的な印象だが、同社は「特定の拠点で発生する輻輳(ふくそう)を早期に収束させるため」に全国フルメッシュ構成を採用していた。これが裏目に出た。今後は東西分散構成に変更するという。 検証報告書を読むと、厄介な出来事が次々と発生して事態が悪化し

    KDDI通信障害の報告書で見えた地獄絵図、痛恨のミスから次々と事態が悪化
  • うつ病でも生きていくための方法(手続き)2022

    会社勤めしてた人向けに。 ・傷病手当をもらう 会社を休職したら給料の6割がもらえる制度。 マックスで1年半もらえる。 2022年から改正されて、「通算で」1年半もらえるようになった。 例えば、今までだとで1ヶ月休職して傷病手当もらってその2年後とかにまた休職、だと2回目の休職時には「1年半経過してるのでもう傷病手当渡せません」ってなってたのが、 改正後だと「前に1ヶ月分だけ傷病手当を渡したので、残りは1年5ヶ月分渡せます」となる。 詳しくは近所の協会けんぽに聞いてみて。 ・自立支援受給者証を作る 指定した精神科・薬局の料金が1割負担で済むようになる。 あと、収入によって月額の上限がある。自分の場合は月5000円だった。 1ヶ月の治療費がどんなにかさんでも5000円を超えることはない。(入院したら別にかかる) 精神科で診断書(3000円はすると思うけど、全然元とれる)を書いてもらおう。それ

    うつ病でも生きていくための方法(手続き)2022