タグ

管理とシステムに関するwasaiのブックマーク (3)

  • 障害の事後分析を読んで得た教訓 ― 「何がシステムを停止させるのか?」 | POSTD

    私はポストモーテム(事後分析)の記録を読むのが大好きです。ポストモーテムを読むと勉強になりますが、大抵の教材的資料とは違って、興味深いストーリーが含まれているのです。相当な時間をかけてGoogleMicrosoftのポストモーテムを読みました。大きな障害を招く最大の原因について、私は(まだ)きちんと分析していませんが、何度も繰り返し目にするポストモーテムのパターンがいくつかあります。 エラーハンドリング 適切なエラーハンドリングのコードを書くのは難しいものです。エラーハンドリングのコードに含まれるバグは、 大きな 問題を引き起こす主な原因となっています。つまり、エラーによってバグのあるエラーハンドリングのコードが実行されるということは、単に個々のエラーが重なるだけという事態にはとどまらないのです。障害が重なって重大なシステム停止につながることはよくあります。それはある意味明らかなことで、

    障害の事後分析を読んで得た教訓 ― 「何がシステムを停止させるのか?」 | POSTD
  • 進化する統合管理ツール - 日経BPシステム運用ナレッジ

    具体的な進化の方向性を紹介する前に、まずは統合管理ツールの定義について、改めて整理したい。 統合管理ツールがカバーする機能は大きく分けて図1のようになる。ベンダーごとに異なるが、少数の製品で幅広い機能を提供する場合もあれば、複数の単機能製品によって幅広い機能を提供する場合もある。 このうち基となる機能は、サーバー機やOSといったシステムに関する情報収集や障害の早期発見を支援する「システム監視」と、ネットワークに関する情報収集や障害の早期発見を支援する「ネットワーク監視」である。システム監視機能では、CPU、メモリー、ディスクの利用状況が収集できる。監視対象の幅広さ(監視対象ハードウエアやソフトウエアの種類)と、きめ細かさ(監視する情報の豊富さ)をベンダー各社が競っており、最近は仮想化技術を利用するプライベートクラウド環境やパブリッククラウド環境への対応が盛んだ(詳しくは後述)。 さら

  • 情報システム部門のタスク管理とIT全般統制 ~ Excel管理からの脱却 ~ (ITS Redmine #RxTstudy #5)

    株式会社 島津ビジネスシステムズ 導入事例: 島津製作所グループの業務システムを引き受ける、情報システム子会社 株式会社 島津ビジネスシステムズでは、IT統制の情報基盤としてITS (Redmine)を全面採用しました。導入の「経過と効用」を題材に、情報 システム部門が抱えるいくつかの課題に対し「課題管理システム」が どの程度有効かという「情報と視点」をコミュニティーにご紹介します。Read less

    情報システム部門のタスク管理とIT全般統制 ~ Excel管理からの脱却 ~ (ITS Redmine #RxTstudy #5)
  • 1