並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 38 件 / 38件

新着順 人気順

大規模システムの検索結果1 - 38 件 / 38件

  • 大規模システムでの Linux のメモリ管理

    (This post is also available in English.) この記事は Linux memory management at scale を 著者の Chris Down さんの許可 を得て Hiroaki Nakamura が日本語に翻訳したものです。 原文のライセンス は CC BY-SA 4.0 であり、翻訳のライセンスも同じく CC BY 4.0 とします。 cgroup2 プロジェクトでの私の仕事の一部として Linux システムのリソース管理についてエンジニアと話すことに多くの時間をかけてきました。 これらの会話を通じてどんどん明らかになってきた 1 つの事実は多くのエンジニアは、シニア SRE たちでさえも、 Linux のメモリ管理についていくつかのよくある誤解を持っていて、そしてそれが彼らがサポートするサービスやシステムが本来確実に稼働したり効率的

      大規模システムでの Linux のメモリ管理
    • Software Design連載 2021年8月号 Python製のレガシー&大規模システムをどうリファクタリングするか - MonotaRO Tech Blog

      Software Design連載開始 ※ (2021/09/02 08:55) 「Pythonを用いて開発を始めたのが2003年」を「Pythonを用いて開発を始めたのが2002年」に修正 こんにちは。金谷です。 このたび、モノタロウにおけるPython大規模開発に関する取り組みを、技術評論社様で発刊されている Software Design に連載させていただくことになりました。 モノタロウがPythonを用いて開発を始めたのが2002年。2021年の現在もPythonを用いた開発が続けられています。 事業の成長に伴い、関連するシステムやエンジニアの数も増え続けていくなかで、いかに安定的に価値を提供し続けられるのか。 モノタロウにおける取り組みを、開発や運用周りを通してご紹介していきます。 本記事の初出は、 Software Design2021年8月号「Pythonモダン化計画(第1

        Software Design連載 2021年8月号 Python製のレガシー&大規模システムをどうリファクタリングするか - MonotaRO Tech Blog
      • 次期全銀システムに影響か、1973年の稼働以来初の大規模システム障害

        全国銀行資金決済ネットワーク(全銀ネット)は2023年10月10日午前、銀行間送金を担う「全国銀行データ通信システム(全銀システム)」で他行宛ての振り込みができないトラブルが発生したと発表した。計画停止を除き、全銀システムで顧客に影響が出るシステム障害が発生したのは、1973年の稼働以来、初めて。2027年の稼働を見込む次期全銀システムの開発にも影響を与えそうだ。

          次期全銀システムに影響か、1973年の稼働以来初の大規模システム障害
        • 大規模システムにおける5つのログ転送パターン

          成功者がどのようにNew Relicを使用してKubernetesのパフォーマンスを4倍に向上させ、拡張性とスループットを改善したかをご覧ください。

            大規模システムにおける5つのログ転送パターン
          • Deep Dive 大規模システムアーキテクチャ/開発組織エンジニアリング / Deep Dive Large-Scale System Architecture, Development Organization Engineering

            学生向けのイベント技育祭2024にて、大規模システムにおけるアーキテクチャの触りをお話したものです。 ビギナー向けなのでそれほど深いお話はしておりません。 【アブストラクト】 本トークでは大規模システムアーキテクチャで考慮すべき事柄とそれを実現する技術スタックや運用システムを深堀りし、それらを…

              Deep Dive 大規模システムアーキテクチャ/開発組織エンジニアリング / Deep Dive Large-Scale System Architecture, Development Organization Engineering
            • 大規模システムのリプレイスを2度経験したPMが語るシステム移行プロジェクトで重要なこと - JMDC TECH BLOG

              JMDCの開発本部データ基盤開発部の新倉です。JMDCには大型案件に自由度高く取り組める環境があります。今回は私が実際に経験したDWHシステムの2度のリプレイスの事例をお伝えします。1度目はPL(プロジェクトリーダー)、2度目はPM(プロジェクトマネージャー)としてプロジェクトに参画。その経験からシステム移行プロジェクトを成功に導くポイントを解説します。 <プロフィール>※執筆当時 新倉 裕一郎(にいくら ゆういちろう)データウェアハウス開発部 データレイクグループ グループリーダー 新卒でソフトウェア会社に入社。大手ベンダー企業の介護パッケージソフト製造などの開発業務に従事。その後、SaaS型CRMサービスを展開するベンチャー企業に転職し、2015年5月に日本医療データセンター(現JMDC)入社。レセプトDWHシステムを担当し、2度のリプレイスを経験。現在はレセプトDWHシステムの保守開

                大規模システムのリプレイスを2度経験したPMが語るシステム移行プロジェクトで重要なこと - JMDC TECH BLOG
              • 大規模システムにおけるディレクトリ構成をRDBのカーディナリティを参考に考える - ぷらすのブログ

                モノリシックなプロジェクトにおいて、トップレベルのディレクトリ構成が異なる 2 つのディレクトリ構成を考え、それらの違いは何で、どちらが優れているか?という問いについて考えた。そして、「複雑な概念をトップレベルのディレクトリ構成にした方が良いのでは?」という結論に落ち着いた話をする。 はじまり ちょっとしたシナリオを想像してみよう。 プロジェクト立ち上げ期 「最近のトレンドはレイヤードアーキテクチャだ!」 そう言って、プロジェクトはスタートした。 . ├── application │ ├── xxx_usecase.go │ ├── xxx_repository.go │ ├── yyy_usecase.go │ └── yyy_repository.go ├── domain │ ├── xxx.go │ └── yyy.go ├── infrastructure │ └── xxx_

                  大規模システムにおけるディレクトリ構成をRDBのカーディナリティを参考に考える - ぷらすのブログ
                • 4ヶ月かかる作業を1ヶ月で完遂。大規模システム開発を高速化させる“タスクフォース型組織” —イオンネクストの事例から学ぶ |AEON TECH HUB

                  人的リソース不足が課題だったイオンネクストでは、「タスクフォース型組織」によって、大規模システム開発の高速化のみならず、エンジニアの成長を促進し、組織の壁を越えた協力体制の構築することに成功しました。イオンネクストの事例から、タスクフォース型組織を成功させるポイントとエンジニアにとっての魅力を探ります。

                    4ヶ月かかる作業を1ヶ月で完遂。大規模システム開発を高速化させる“タスクフォース型組織” —イオンネクストの事例から学ぶ |AEON TECH HUB
                  • 大規模システム障害、世界数千件に影響 1500億円損失も - 日本経済新聞

                    【ニューヨーク=白岩ひおな】8日に起きた米fastly(ファストリー)による世界的な大規模システム障害で、ウェブサイトの閲覧不能や取引の一時停止に見舞われた企業や政府機関のサイトは数千件に上った。アマゾンやイーベイなど電子商取引(EC)企業のサイトも含まれ、世界の小売業に与えた損失は約1500億円超に上るとの試算もある。ウェブコンテンツを素早く配信できる利便性の裏で、サービスを提供する一部の企業

                      大規模システム障害、世界数千件に影響 1500億円損失も - 日本経済新聞
                    • ファミマで「大規模システム障害」が判明、スタッフ数千人の給与支払いに被害

                      南アフリカ・ヨハネスブルグ出身。講談社「FRIDAY」、文藝春秋「週刊文春」記者を経て、ジャーナリストとして独立。日韓関係、人物ルポ、政治・事件など幅広い分野の記事執筆を行う。著書に『韓国人、韓国を叱る 日韓歴史問題の新証言者たち』(小学館新書)、『完落ち 警視庁捜査一課「取調室」秘録』(文藝春秋)など。スクープの裏側を明かす「元文春記者チャンネル」YouTubeにて配信中。Note https://note.com/akaishi01 Twitter:@red0101a DOL特別レポート 内外の政治や経済、産業、社会問題に及ぶ幅広いテーマを斬新な視点で分析する、取材レポートおよび識者・専門家による特別寄稿。 バックナンバー一覧 ファミリーマートで大規模なシステム障害が起きていることが、同社への内部取材で明らかになった。約7000店舗、数千人のアルバイトスタッフの給与支払いに影響が出て、

                        ファミマで「大規模システム障害」が判明、スタッフ数千人の給与支払いに被害
                      • ガーミンが大規模システム障害はランサムウェアによるサイバー攻撃であったことを認める

                        現地時間2020年7月23日から続いていた、GPS機器やウェアラブル端末を扱うガーミン(Garmin)のシステム障害について、公式にランサムウェアによるサイバー攻撃を受けたものであったことが発表されました。 Garmin issues statement on recent outage | Business Wire https://www.businesswire.com/news/home/20200727005634/en/Garmin%C2%AE-issues-statement-outage/ システム障害は、ガーミンが提供する「Garmin Connect」を中心とした大規模なもので、一時はサーバーステータスの表記がすべて「DOWN」となっていました。 GPS機器大手・ガーミンの全サービスが異例の長期間停止、原因はランサムウェア攻撃か - GIGAZINE 7月28日(火)現

                          ガーミンが大規模システム障害はランサムウェアによるサイバー攻撃であったことを認める
                        • ファミマで「大規模システム障害」が判明、スタッフ数千人の給与支払いに被害(ダイヤモンド・オンライン) - Yahoo!ニュース

                          ファミリーマートで大規模なシステム障害が起きていることが、同社への内部取材で明らかになった。約7000店舗、数千人のアルバイトスタッフの給与支払いに影響が出て、ファミマ本社は大混乱に陥った。その中で浮かび上がってきたのは、ファミマを完全子会社化した伊藤忠商事とファミマの現場との対立構造だった。(フリージャーナリスト 赤石晋一郎) 【ファミマ、セブン、ローソンの既存店売上高の「比較分析表」はこちら】 ● ファミマで大規模システム障害 約7000店、数千人の給与支払いに影響 ファミリーマートで大規模なシステム障害が起きていることが、同社への内部取材で明らかになった。 トラブルが起きたのはファミマ店舗の人事給与システムで、東日本エリアの加盟店の多くがトラブルによる被害を受けたという。 「人事給与システムにトラブルが起きたことで勤怠(出勤や退勤をはじめとした従業員の出勤状況)データや給与計算、振り

                            ファミマで「大規模システム障害」が判明、スタッフ数千人の給与支払いに被害(ダイヤモンド・オンライン) - Yahoo!ニュース
                          • 大規模システム障害 1社の綻び、バグ拡大で世界がまひ - 日本経済新聞

                            インターネットの大規模なシステム障害の影響が世界に広がった。航空会社などで復旧が進むものの、原因の詳細は分かっていない。社会に欠かせないネットのシステムは多数のソフトウエアを組み合わせて動く。1社の綻びが世界のインフラをまひさせており、「デジタル供給網」の落とし穴があらわになった。「予約サイトに異常が出ている」。19日午後2時20分ごろ、日本航空の予約サイトが使えなくなり、ウェブサイトやアプリ

                              大規模システム障害 1社の綻び、バグ拡大で世界がまひ - 日本経済新聞
                            • みずほ 大規模システム障害 “二重故障”想定せず復旧遅れ | NHKニュース

                              みずほフィナンシャルグループは、ことし8月に発生した大規模なシステム障害の原因について、二重に装置が故障する極めてまれなトラブルを想定していなかったことが復旧の遅れにつながったと、明らかにしました。 ことし8月19日の夜に発生したシステム障害では、みずほ銀行とみずほ信託銀行の全国およそ520店舗で、翌日の朝から正午ごろにかけて、窓口での振り込みや入金などの取り引きができない状態になりました。 みずほは8日、このシステム障害の詳しい原因について調査の結果を明らかにしました。 それによりますと、この障害ではまず、いわゆるメインシステムと各店舗の端末などをつなぐ部分で、2台同時に作動しているハードディスク装置のうちの1台が故障したということです。 残りの1台は、いったん単独で作動を始めましたが、およそ1時間後にこちらの装置も故障したということです。 調査結果では、こうした二重に装置が故障する極め

                                みずほ 大規模システム障害 “二重故障”想定せず復旧遅れ | NHKニュース
                              • 世界各地での大規模システム障害 問題検知できず配信が原因 | NHK

                                日本時間の19日に世界各地で発生した大規模なシステム障害について、情報セキュリティー会社「クラウドストライク」は、問題のあるデータを含んだファイルを検知できずに配信したことが障害につながったなどとする検証結果を発表しました。 日本時間の19日に発生したシステム障害は、ヨーロッパやアジア、アメリカの空港に広がったほか、医療機関やテレビ局の放送など、幅広い分野に影響を与えました。 このシステム障害の原因について、アメリカの情報セキュリティー会社「クラウドストライク」は24日、自社のセキュリティーソフトを更新する際に問題がないかどうかを調べるソフトウエアに欠陥があり、問題のあるデータを含んだファイルを検知できずに配信したことが障害につながったなどとする検証結果を発表しました。 アメリカのIT大手「マイクロソフト」によりますと、システム障害は「クラウドストライク」のセキュリティーソフトの更新にとも

                                  世界各地での大規模システム障害 問題検知できず配信が原因 | NHK
                                • 大規模システム障害で米国が大混乱、「クラウドストライクショック」いまだ収まらず

                                  米CrowdStrike(クラウドストライク)のセキュリティー製品のバグに端を発した世界的なシステム障害が収まらない。米国では発生から2日以上経過した2024年7月21日正午時点(米国時間、以下同)でも、航空業界を中心にトラブルが続いており、専門家などは「史上最大のIT(情報技術)障害」と指摘する。影響の大きさと判明している原因をリポートする。 バグが見つかったのはクラウドストライクの「Falcon」Windows版に提供されたアップデートファイル。Falconはマルウエアなどの攻撃を防ぐセキュリティープラットフォームで、PCなどの端末にエージェントソフトウエアをインストールして脅威を検出する。このエージェントソフトウエアのアップデートに含まれていたファイル「C-00000291*.sys」に不具合があった。問題が見つかったのはWindows版のみで、Mac版とLinux版には影響がないこ

                                    大規模システム障害で米国が大混乱、「クラウドストライクショック」いまだ収まらず
                                  • 大規模システム障害、原因は品質管理の不具合=クラウドストライク

                                    7月24日、米サイバーセキュリティー企業クラウドストライクは先週に世界各地で起きた大規模なシステム障害について、同社の品質管理ツールの不具合が原因だったと明らかにした。19日、米ニューアーク国際空港で撮影(2024年 ロイター/Bing Guan) [ロンドン 24日 ロイター] - 米サイバーセキュリティー企業クラウドストライク(CRWD.O), opens new tabは24日、先週に世界各地で起きた大規模なシステム障害について、同社の品質管理ツールの不具合が原因だったと明らかにした。 システムを悪質なソフトウエアやハッカーから守る同社のプラットフォーム「ファルコン」に、マイクロソフトの基本ソフト(OS)ウィンドウズで作動するコンピューターを強制的に停止させる不具合が含まれていたため、大規模なシステム障害が発生したという。

                                      大規模システム障害、原因は品質管理の不具合=クラウドストライク
                                    • 大規模システム障害、クラウドストライクの検査ツールが欠陥見落とす

                                      米サイバーセキュリティー会社クラウドストライク・ホールディングスは24日、世界各地に影響が広がった大規模なシステム障害の原因について、ソフトウエアの更新版に欠陥がないかを検査する品質保証ツールに不具合があり、結果的に問題のソフトが顧客に流出してしまったとする報告書を発表した。 同社は先週19日、変化する脅威に即座に対応するためのメカニズムを通じて、ウィンドウズ用の更新版ソフトを配布。だが、品質保証ツールが正常に機能せず、この更新版に含まれていた重大な欠陥を見逃してしまった。これにより、世界規模のシステム障害を引き起こし、航空会社や銀行、病院などで業務に多大な支障が生じた。

                                        大規模システム障害、クラウドストライクの検査ツールが欠陥見落とす
                                      • 中国、大規模システムでウイグル族監視 個人情報で「危険分子」抽出 - 毎日新聞

                                        観光名所「国際大バザール」内にかけられる赤ちょうちん=中国新疆ウイグル自治区ウルムチ市で2019年6月24日、工藤哲撮影 中国政府が新疆ウイグル自治区でイスラム教徒の少数民族ウイグル族らを監視する大規模システム「一体化統合作戦プラットフォーム」(IJOP)を構築し行動を把握、恣意(しい)的な拘束や施設への大量収容を行っていた。監視カメラの映像や携帯電話の中身などあらゆる個人情報を解析し、多数のウイグル族を潜在的「危険分子」としていた。 この記事は有料記事です。 残り744文字(全文903文字)

                                          中国、大規模システムでウイグル族監視 個人情報で「危険分子」抽出 - 毎日新聞
                                        • マクドナルドで大規模システム障害、手計算で応戦する店員の頑張りも虚しく億単位の売上が吹き飛ぶ : 市況かぶ全力2階建

                                          新宿のサマソニ「新宿三井ビルディング会社対抗のど自慢大会」、2024年はウィルオブ・コンストラクションが優勝 自民党総裁選は勝ち確みたいな雰囲気の小泉進次郎さん、神奈川選挙区にあるだけの百貨店「さいか屋」と語感が似ているだけの「オーイズミ」「勤次郎」の株を動かす

                                            マクドナルドで大規模システム障害、手計算で応戦する店員の頑張りも虚しく億単位の売上が吹き飛ぶ : 市況かぶ全力2階建
                                          • “1万9000人リストラ策”の影響も…みずほ銀行「大規模システム障害」が繰り返されるワケ | 文春オンライン

                                            だが、みずほ銀行は発足直後の2002年、東日本大震災直後の2011年3月にも大規模システム障害を起こしている。何故、みずほだけがシステム障害を繰り返すのか。その原因は報告書には表れようのない合併の深層に隠されている。 日本のSEが“蒸発した”と言われるシステム “みずほ”という名称は万葉集の「豊葦原の瑞穂の国」からとられている。みずほ銀行は日本そのものを表象する銀行という意味である。実際、みずほ銀行は上場企業の約7割と取引を持ち、約2400万の個人口座を誇る巨大銀行だ。「資産規模トップの第一勧銀」、「実質的にトップバンクであった富士銀行」、「天下国家を体現する興銀」の3行が統合して誕生した。それぞれ頂点を自負する3行が一緒になったことで、皮肉にも内部の主導権争いは、長くみずほの宿痾となっていく。 その象徴が3行のシステム統合であった。銀行は装置産業である。基幹を司る勘定系システムは、第一勧

                                              “1万9000人リストラ策”の影響も…みずほ銀行「大規模システム障害」が繰り返されるワケ | 文春オンライン
                                            • プロトタイピングからはじめる大規模システムリニューアルと新機能開発 - asoview! Tech Blog

                                              アソビューAdvent Calendar 2022の7日目の記事です。 こんにちは。 10月中旬にアソビュー株式会社にフロントエンドエンジニアとして入社いたしまして、入社後およそ2ヶ月ほど経ちました櫻井と申します! 入社直後ですが、アドベントカレンダーを書くという無茶振り(?)を受け、何を書こうか迷っていたのですが、入社直後にジョインしたプロジェクトが実はスタートしたばかりということもあり、まさに今、プロトタイピングから始めているということについて書こうかなと思います。 はじめに プロトタイプとは? プロジェクトの状況 概要 体制 ユーザーストーリーマッピング 具体的な進め方 プロトタイピングの目的 適切なコミュニケーション 技術的な検証 よかったこと/わかったこと より実際のサービスに近い機能のイメージがしやすくなる 共有→フィードバックのサイクルが早くなる プロトタイピングを繰り返す

                                                プロトタイピングからはじめる大規模システムリニューアルと新機能開発 - asoview! Tech Blog
                                              • 大規模システムにおけるインスタンス基盤障害の対応自動化に関して[DeNA インフラ SRE] | BLOG - DeNA Engineering

                                                こんにちは、IT 基盤部の 萩行 です。大規模ゲームタイトルのインフラを運用しております。 私の所属しているグループでは数千台規模のインスタンスを管理しており、インスタンス数に比例してインスタンスの基盤障害が多く発生しています。 本記事ではインスタンス基盤障害に対して、どういう仕組みで対応を自動化したかをお伝えいたします。 基盤障害対応の自動化以前 これらのインスタンスは、重み付けラウンドロビンの機能を持つ internal DNS を使用して、負荷分散・冗長化を実現しています。 インスタンスの障害時には、独自のヘルスチェッカーが通信不可を検知し、該当インスタンスの重みを 0 にします。その結果、リクエストが故障インスタンスに振り分けられないようになり、サービス影響を数秒程度におさえる仕組みになっています。 しかし、その後の復旧処理に関しては、オペレータが手動で対応していました。 インスタ

                                                  大規模システムにおけるインスタンス基盤障害の対応自動化に関して[DeNA インフラ SRE] | BLOG - DeNA Engineering
                                                • 2024年7月の世界的な大規模システム障害から学ぶこと〜企業が留意すべき未来に向けたベストプラクティス〜 | インシデント管理プラットフォーム│PagerDuty

                                                  2024年7月19日(金)に発生した、世界規模のシステム障害(インシデント)においてPagerDutyが分析したところ、インシデント発生は通常と比較して最大150%増加しており、PagerDuty上での復旧作業には通常よりも200%多い人員が投入されたことがわかりました。 この数ヶ月間で重大インシデントは前年比で40%増加しており、さらに、PagerDutyが2024年6月に公表したグローバル調査によると、ITリーダーの90%がシステム障害に起因する混乱が企業に対する顧客の信頼を低下させたと回答しています。また、ITリーダーの69%が障害が発生した際に顧客からの信頼を保つための投資が不足しているとも回答しています。 日々の業務、日常生活がデジタル化されている今日において、このようなインシデントはもはや避けることが難しく、インシデント発生はある種の”New Normal”であると言えるでしょ

                                                    2024年7月の世界的な大規模システム障害から学ぶこと〜企業が留意すべき未来に向けたベストプラクティス〜 | インシデント管理プラットフォーム│PagerDuty
                                                  • 世界各地で大規模システム障害 影響受けた端末は推定850万台 | NHK

                                                    日本時間の19日、世界各地で、コンピューターのセキュリティーソフトが原因となって、大規模なシステム障害が起きたことについて、マイクロソフトは、影響を受けた端末は、推定で850万台に上ることを明らかにしました。 日本時間の19日に発生したシステム障害は、ヨーロッパやアジア、アメリカの空港に広がったほか、中東などの医療機関、イギリスのテレビ局の放送など、幅広い分野に影響を与えました。 アメリカのIT大手マイクロソフトなどによりますと、このシステム障害は、アメリカの情報セキュリティー会社、「クラウドストライク」のソフトウエア「ファルコン」の更新にともない、マイクロソフトの基本ソフト、ウィンドウズを搭載した端末で起きたということです。 これについてマイクロソフトは20日、影響を受けた端末は推定で850万台に上ることを明らかにしました。 これはウィンドウズを搭載している端末の1%未満だったということ

                                                      世界各地で大規模システム障害 影響受けた端末は推定850万台 | NHK
                                                    • なぜ大規模システム向け「マネージドモニタリング for Zabbix」なのか― IIJだからできる!エンタープライズ向け総合ソリューション | IIJ Engineers Blog

                                                      サポートセンター勤務、システム監視運用設計担当を経てIIJ統合運用管理サービス(UOM)を始めとする、アウトソーシングサービスの企画/開発に従事。 IIJの福原です。 サポートセンターの24-365勤務、システム監視運用設計担当を経て、IIJ統合運用管理サービスの企画/開発に従事しています。 今回は「IIJ統合運用管理サービス(UOM) マネージドモニタリング for Zabbix」の開発背景をご紹介します。 時代に合った、新しい運用ソリューションの必要性 「IIJ統合運用管理サービス(以下、UOM)」は「PATROLCLARICE(パトロールクラリス、通称パトクラ)」を使ったSaaS型の監視サービスを提供しています。PATROLCLARICEは、現場のプロフェッショナルエンジニアが求める細かな項目や設定に幅広く対応し、Amazon CloudWatchやAzure Monitorにも対応

                                                        なぜ大規模システム向け「マネージドモニタリング for Zabbix」なのか― IIJだからできる!エンタープライズ向け総合ソリューション | IIJ Engineers Blog
                                                      • リクルートのプロダクト開発チームが明かす、大規模システム改修・新規サービス開発の舞台裏──RECRUIT TECH MEETUP #1 - TECH PLAY Magazine

                                                        飲食店のオーダーエントリーシステム『Airレジ ハンディ』、『ホットペッパービューティー』の新ジャンルとなる美容クリニックの予約サービス、宿・ホテル予約サイトの『じゃらんnet』の10年以上続くシステムなど。リクルートが提供するライフスタイル領域(旅行、飲食、ビューティー)のプロダクト開発における様々な取り組みを紹介する。 ■登壇者プロフィール 株式会社リクルート プロダクト統括本部 飲食プロダクト開発G 早川 浩平氏 2016年にリクルートに新卒入社し、海外向け新規サービスのiOSアプリ開発を担当。その後『Airレジ ハンディ』のサーバサイドとフロントエンドの開発を経て、2019年から『Airレジ ハンディ セルフオーダー』の開発の立ち上げと推進に従事。 株式会社リクルート プロダクト統括本部 飲食プロダクト開発G 松尾 裕幸氏 2019年リクルートに新卒入社。『Airレジ ハンディ』の

                                                          リクルートのプロダクト開発チームが明かす、大規模システム改修・新規サービス開発の舞台裏──RECRUIT TECH MEETUP #1 - TECH PLAY Magazine
                                                        • 数千rpsを処理する大規模システムの配信ログをHadoopで分析できるようにする 〜 ショッピングのレコメンドシステム改修

                                                          ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。サイエンス統括本部でYahoo!ショッピングのレコメンドシステムを開発している山口です。 本記事では、システムの配信ログを大規模データの分散処理が可能な社内のApache Hadoop環境(以下Hadoop)に保存できるように、システム改修した取り組みについて紹介します。 今回改修したレコメンドシステムは、毎秒数千のリクエストを処理する大規模なシステムです。レコメンドシステムから直接Hadoop環境に大量のログを送れるようになったことで、配信情報を素早く、そして簡単にログとして保存できるようになり、日々レコメンドの機械学習モデル改善に役立っています。 Yahoo!ショッピングのレコメンドとは Yahoo!ショッピングで

                                                            数千rpsを処理する大規模システムの配信ログをHadoopで分析できるようにする 〜 ショッピングのレコメンドシステム改修
                                                          • みずほ銀で大規模システム障害 全店舗で窓口取引できず、ATMは通常通り

                                                            同行では2月から3月にかけて、システム障害が相次いで発生。一部のATMで取引などができなくなり、ATMに挿入した通帳やキャッシュカードが戻ってこないなどの不具合が発生していた。これを受け、外部調査を行い、再発防止策を策定していた。 関連記事 「問題の根底には企業風土」──みずほFG、銀行システム障害の調査報告書を公開 みずほフィナンシャルグループ(FG)は6月15日、2月以降、みずほ銀行のATMで立て続けに発生したシステム障害について、外部調査の報告書を発表。 ATMシステム障害でみずほFGが中間報告 再発防止へ開発体制や情報共有を強化 みずほ銀行のATMでシステム障害が多発していた問題で、みずほフィナンシャルグループ(FG)の坂井辰史社長が記者会見を行い、検証の中間報告と再発防止策を公表した。システムの開発人員の増員や、危機管理上の情報共有の体制強化などを再発防止策に盛り込んだ。 みずほ

                                                              みずほ銀で大規模システム障害 全店舗で窓口取引できず、ATMは通常通り
                                                            • ぷらっとホーム、大規模システム向けSyslogサーバーアプライアンス「EasyBlocks Syslog ProLine」を発表

                                                                ぷらっとホーム、大規模システム向けSyslogサーバーアプライアンス「EasyBlocks Syslog ProLine」を発表
                                                              • 大規模システム障害、世界の目はサイバー企業クラウドストライクに

                                                                大規模システム障害、世界の目はサイバー企業クラウドストライクに Jordan Robertson、Shona Ghosh 19日に発生した世界的なシステム障害は、あるサイバーセキュリティー企業のソフトウエアが原因で起こった。その企業とは、クラウドストライク・ホールディングスだ。 世界でシステム障害、経済活動混乱-根本原因は解決とマイクロソフト クラウドストライクは、ランサムウエア(身代金要求型ウイルス)の攻撃から企業を守るソフトウエアの主力企業として知られる。顧客は銀行や世界的な小売り大手、医療システムなど幅広い分野にわたっており、クラウドストライクは今回のシステム障害に対応する中で大きく注目を集めることとなった。 クラウドストライクは、アンチウイルスのパイオニアであるマカフィーの元幹部が設立。比較的新しいタイプのセキュリティーソフトウエアのトップメーカーに成長した。ランサムウエアなどハッ

                                                                  大規模システム障害、世界の目はサイバー企業クラウドストライクに
                                                                • “1万9000人リストラ策”の影響も…みずほ銀行「大規模システム障害」が繰り返されるワケ(文春オンライン) - Yahoo!ニュース

                                                                  みずほフィナンシャルグループ(FG)の坂井辰史社長は、今年度に予定していた全国銀行協会の会長就任を辞退した。システム障害を受け、これまでは会長就任を「当面」見合わせるとしていたが、2月末から頻発したシステム障害の再発防止を優先すると辞退を申し出た。 【写真】この記事の写真を見る(3枚) みずほFGは3月31日に、システム障害を巡る一連の経緯や再発防止策をまとめた中間的な報告書を金融庁に提出。坂井社長は4月5日記者会見を開き、「システム障害に係る対応状況について」と題する原因分析資料を公表した。今後、第三者委員会「システム障害特別調査委員会」等による調査・提言を踏まえて最終報告書をまとめる意向だ。 だが、みずほ銀行は発足直後の2002年、東日本大震災直後の2011年3月にも大規模システム障害を起こしている。何故、みずほだけがシステム障害を繰り返すのか。その原因は報告書には表れようのない合併の

                                                                    “1万9000人リストラ策”の影響も…みずほ銀行「大規模システム障害」が繰り返されるワケ(文春オンライン) - Yahoo!ニュース
                                                                  • IIJ、Zabbixを利用した大規模システム向け運用管理サービスを提供

                                                                      IIJ、Zabbixを利用した大規模システム向け運用管理サービスを提供
                                                                    • みずほ銀行に足りなかった「顧客目線」、大規模システム障害での情報開示に学ぶ

                                                                      どんなに手を尽くしても、システム障害やセキュリティー事故をゼロにはできない。危機管理広報の専門家によれば、インシデントが発生した際、企業にとって重要なのは、迅速で顧客目線を持った情報開示だという。 その事実を世に知らしめた顕著な例が、みずほ銀行のシステム障害における情報開示である。同行は2021年2月から2022年2月までの約13カ月間に合計11回のシステム障害を起こした。金融庁は2021年11月26日にみずほフィナンシャルグループ(FG)と同行に業務改善命令を発出した際に「社会インフラの一翼を担う金融機関としての役割を十分に果たせなかったのみならず、日本の決済システムに対する信頼性を損ねた」と厳しく指摘するほどの社会的な混乱を招いたといえる。 当時の反省を踏まえて同行は現在、有事の際の情報開示の在り方を見直している。経緯を具体的に見ていこう。 4時間以上もATM前で立ち往生 最初のシステ

                                                                        みずほ銀行に足りなかった「顧客目線」、大規模システム障害での情報開示に学ぶ
                                                                      • お客さまと同じ立場に立ち共にサービスをよくしていく――お客さまのマインドまでも変えていく大規模システムでのUXデザインへのチャレンジ | gihyo.jp

                                                                        お客さまと同じ立場に立ち共にサービスをよくしていく――お客さまのマインドまでも変えていく大規模システムでのUXデザインへのチャレンジ NTTデータでサービスデザイナーとして働いている、HCD-Net認定 人間中心設計スペシャリストの風間みなみ氏。モバイル系の部署に所属し、お客さまの新規サービスや既存サービスの改善に関わっているそうです。人間中心設計の思想に基づき、仮説立案からサービスリリース後の改善まで、お客さまと二人三脚でエンドユーザにサービスを届けています。現場でどのような活躍をされているのか、お話を伺いました。 NTTデータ サービスデザイナー、HCD-Net認定 人間中心設計スペシャリストの風間みなみ氏 ひとつひとつのエンドユーザの声が届いた結果、顧客の中に変化が生まれ、一緒にサービスを良くしていく 当時は、エンドユーザを中心に考えられていない案件のほうが多かったと、風間氏は数年前

                                                                          お客さまと同じ立場に立ち共にサービスをよくしていく――お客さまのマインドまでも変えていく大規模システムでのUXデザインへのチャレンジ | gihyo.jp
                                                                        • みずほ銀行で大規模システム障害、「3度目」防げず信頼回復遠のく

                                                                          みずほ銀行は2021年2月28日、大規模なシステム障害を起こした。ATMやインターネットバンキングで一部取引が不能になり、キャッシュカードや通帳などがATMに取り込まれたまま戻ってこない不具合も多発した。みずほ銀行は2002年と2011年にも大規模なシステム障害を起こしている。信頼回復を期し4000億円以上を投じて勘定系システムを全面刷新したが、「3度目」を防げなかった。 「ATMに通帳が取り込まれたまま出てこない。自宅にも帰れず、どうしたらいいのか」。2月28日午後1時ごろ、東京・品川のみずほ銀行の出張所で、50代の男性会社員は途方に暮れた。 システム障害が発生したのは2月28日午前。店舗内外の自行ATMやインターネットバンキングの「みずほダイレクト」において、一部の取引ができなくなった。キャッシュカードや通帳がATMに取り込まれたまま戻ってこない不具合も各地で発生し、顧客が店舗などに足

                                                                            みずほ銀行で大規模システム障害、「3度目」防げず信頼回復遠のく
                                                                          • 「人手不足で断られた」首相肝いりの行政事務統一、間に合わない自治体も 減税の大規模システム改修で負荷増大(西日本新聞) - Yahoo!ニュース

                                                                              「人手不足で断られた」首相肝いりの行政事務統一、間に合わない自治体も 減税の大規模システム改修で負荷増大(西日本新聞) - Yahoo!ニュース
                                                                            • 大規模システムの運用により若手が得たスキルや気付き [DeNA インフラ SRE] | BLOG - DeNA Engineering

                                                                              ※こちらは先日実施された DeNA インフラエンジニア / SRE MEETUP で話した内容を Blog 記事化したものです! はじめに こんにちは。 IT 基盤部の安藤です。 IT 基盤部にて、ゲームプラットフォーム及びオートモーティブ事業のインフラの運用を主に担当しております。 大規模システムの運用を経験し、どんな規模のサービスでも管理できるようになりたい。そう思っているインフラエンジニア、SREの方々は多いのではないでしょうか? DeNA グループ全体のシステム基盤を横断して管理しているインフラ部門、IT 基盤部。その IT 基盤部では多くの新卒入社エンジニアがゼロから経験を積み、それら大規模なシステムを管理してくための様々な学びを得ています。 本記事では、「そういった大規模システムを管理するための学び」について、若手エンジニアが入社して行った具体的な経験を IT 基盤部配属後にど

                                                                                大規模システムの運用により若手が得たスキルや気付き [DeNA インフラ SRE] | BLOG - DeNA Engineering
                                                                              1