タグ

運用に関するfukumuraのブックマーク (8)

  • AWS運用でよく聞く不安とその対策を書き出してみた | DevelopersIO

    はじめに 皆さまがシステムを運用にするあたり、様々な不安を抱えていらっしゃると思います。 そういったよくある「不安」を書き出し、解消するための対策や参考ページなども記載しましたので、記事をご覧いただいている皆さまには抱えている不安を淡々と潰していただければと思います。 【ケース1】大量のアクセスによる高負荷への不安 近日中に Web サイトの広告を出す予定だが、現状のままで増加するアクセスに対応できるのか不安がある 以下のような対策が考えられます ELB(Elastic Load Balancing)を使用し、Webサーバー(Amazon EC2)の複数台構成にする アクセス数や負荷に応じて自動で Webサーバー(Amazon EC2)の台数を増やす(スケールアウト)、減らす(スケールイン)ために AWS Auto Scaling を使用する ELB の暖機申請(予め AWS へ連絡して

    AWS運用でよく聞く不安とその対策を書き出してみた | DevelopersIO
    fukumura
    fukumura 2018/08/21
    これはよくまとまっててすごい助かるかも!
  • システム運用の判断業務をAIで自動化 エンジニアの呼び出し要否を判断――日本ユニシスと日立が共同検証

    ユニシスと日立製作所(以下、日立)は2018年4月5日、システム運用で人の判断を必要とする非定型業務をAIで自動化する共同検証を4月から開始したと発表した。 検証は日ユニシスが運用する金融機関の基幹システムの番運用環境で行い、システムの警告メッセージが発生した際にエンジニアの呼び出しが必要かどうかの判断を、機械学習したAIに自動判断させる。 通常はイベント通知に応じてオペレーターが運用手順書を参照しながら判断するエンジニアの呼び出し要否を、運用手順書の項目やパラメーター情報、過去の対応履歴を機械学習することで自動化。さらに、オペレーターやエンジニアからのフィードバックを継続的に学習し、判断精度の向上を図る。 AIの運用基盤には、日立のシステム運用管理ソフトウェア「JP1」とAIを組み合わせて構築し、OSS(オープンソースソフトウェア)を基にした機械学習技術を用いる。 今回の検証に先

    システム運用の判断業務をAIで自動化 エンジニアの呼び出し要否を判断――日本ユニシスと日立が共同検証
    fukumura
    fukumura 2018/04/07
    システムは各社で違うものなので、各社で集めた教師データが正しいかは甚だ疑問。判断を間違えて被害が拡大した時に自分なら責任がとれない気がするなぁ
  • DBサーバ向けLinuxチューニングを考える 〜 メモリオーバーコミット編 : DSAS開発者の部屋

    Cでプログラムを書いていて大量のメモリを確保したくなったとき、大抵は mallocを使うと思いますが、その際には戻り値がNULLかどうかを判断してエラー処理に飛ばすと思います。しかし、Linux のメモリ管理サブシステムには「メモリ・オーバーコミット」という機構があり、実装されているメモリ以上の領域を確保できてしまいます。 #include <stdio.h> #include <stdlib.h> int main() { int i; char *p; for(i=0;i<65536;i++){ p = (char *)malloc(65536); if(0 == (long)p){ break; } } printf("SIZE=%dMB\n",i*65536/1024/1024); return(0); } swapoff したメモリ 1G のマシンでこれを実行するとこんな感じにな

    DBサーバ向けLinuxチューニングを考える 〜 メモリオーバーコミット編 : DSAS開発者の部屋
  • トラブルをわざと発生させサーバ問題解決能力を鍛える「Trouble-Maker」 - GIGAZINE

    ほとんどのシステム管理者が経験したことがあるはずの状況は「何か悪いことが起きていて、サーバがダウンしているが、しかし何が起きているのか分からない」というシチュエーション。サーバを管理するシステムアドミニストレーターなどの立場でいると何が大変かというと、実際の製品として動かしている実環境でこのような問題が発生した場合です。 そこで役に立つのがこのオープンソースソフト「Trouble-Maker」です。 Trouble-Maker http://trouble-maker.sourceforge.net/ システム管理者の仕事を簡単にするため、多くのツールが存在していますが、未知の状況を経験している場合になんとかしてくれるわけではありません。この一連のソフトウェア群「Trouble-Maker」は既存の便利なツールとは異なり、問題を解決するのではなく、むしろ問題を引き起こします。インストールし

    トラブルをわざと発生させサーバ問題解決能力を鍛える「Trouble-Maker」 - GIGAZINE
    fukumura
    fukumura 2011/12/09
    これはイイと思う。昔、障害対応練習って項目だけ作って実施しなかった思い出が。
  • 月間57億PV、300台のサーバを運用するミツバチワークスが編み出したインフラ技術

    ミツバチワークスのエンジニアは、「月間57億PV」という巨大なトラフィックをさばくため、さまざまな技術を駆使してインフラを構築している。主と副の2立てでデータベースを運用し、300台のサーバを使いながら「負荷の限界」に挑むエンジニアに、技術ノウハウを聞く。 ミツバチワークスが運営するケータイブログサービス「DECOLOG」は、異色のサービスである。10代後半から20代前半の女性に最も人気のあるケータイブログサービスで、「デコメール」などを利用して、かわいくカラフルなブログを作成できる。広告基準を厳しくすることで女性ユーザーにも不安なく使ってもらえるような安心感を作り出し、口コミだけでじわじわとアクセス数を伸ばしてきた。 結果、2010年7月実績で月間57億PV(ページビュー)超、想定800万UU(ユニークユーザー)、会員登録者数180万件と、ケータイブログサイトでは国内最大のサービスとし

    fukumura
    fukumura 2010/09/03
    アクセス解析→改善のはやさがすごい・・・。
  • livedoor Techブログ : ライブドア流自作サーバ

    livedoorポータルサイト等のインフラを担当している片野です。 今回は若干いまさら感がありますが、弊社にて運用している自作サーバをご紹介します。 (検証機以外は弊社内で組み立ててないので、正確には自作してないんですがw) ■背景 去年は特に自作サーバが盛り上がっていましたし、早い段階で「うちも作るか!」という展開はあったんですが、弊社では以下のような事情もあり、着手していませんでした。 ・自社データセンタでの運用なため、その他顧客と運用が大きく変わるようなサーバを投入すると運用が煩雑になる。 ・ポータルのサービスだけでも3000台近いサーバがあり、規模的にも運用に手がかかるサーバを入れるのは非現実的。 ・ボリュームメリットが出せるため、コスト面での自作メリットはそれほど大きくない。 ・そもそも自作で間に合う台数じゃないw (人的な)運用コストや調達コスト面ではあまりメリットがないのです

  • PDCAが回らないのはなぜ? 間違いだらけの運用改善を正す【MarkeZine Day 2009】

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    PDCAが回らないのはなぜ? 間違いだらけの運用改善を正す【MarkeZine Day 2009】
  • "Wakame" は三年後、「あれはイノベーションだった」と言われても不思議じゃないソフトウェアだ - @kyanny's blog

    先週、株式会社あくしゅさんの新しいオフィスに遊びに行ったとき、 "Wakame" という不思議な名前のソフトウェアのプレゼンテーションがあった。それは衝撃的なソフトウェアで、三年後「あれはイノベーションだった」と言われても不思議ではないと、気で思った。すごく興奮していたが、「来週水曜にリリースするからそれまで黙っててね!」と言われていて、今日やっと "Wakame" についてブログに書くことができるので、僕が見たこと、感じたことを包み隠さず、いまからここで書きます。 "Wakame" は、 Amazon EC2 上で自律的に動作する、サーバマネージングソフトウェアだ。 Amazon EC2 を知っている人向けにごくごく簡単に説明すると、コマンド一発でインスタンスの増減やアプリケーションの複製を管理できる。 Amazon EC2 を知らない人(まぁ僕のブログの読者にそういう人はあまり多くな

    "Wakame" は三年後、「あれはイノベーションだった」と言われても不思議じゃないソフトウェアだ - @kyanny's blog
  • 1