タグ

関連タグで絞り込む (221)

タグの絞り込みを解除

infraに関するnsyeeのブックマーク (350)

  • サービス障害を起こさないために、障害を起こし続ける。逆転の発想のツールChaos Monkeyを、Netflixがオープンソースで公開

    サービス障害を起こさないために、障害を起こし続ける。逆転の発想のツールChaos Monkeyを、Netflixがオープンソースで公開 米国でビデオオンデマンドサービスを提供しているNetflixは、Amazonクラウド上でわざとシステム障害を起こすためのツール、Chaos Monkeyをオープンソースで公開しました。 Chaos MonkeyはAmazonクラウド上で使うツール。Amazonクラウド上のインスタンスをランダムに落としまくることで、サービスに対して仮想的な障害を引き起こしてくれます。 NetflixはこのChaos Monkeyを実環境で使うことで、物の障害が起きたとしてもサービスが継続できることをテストし続けてきました。Netflixのブログ「Chaos Monkey released into the wild」から引用します。 There are many fail

    サービス障害を起こさないために、障害を起こし続ける。逆転の発想のツールChaos Monkeyを、Netflixがオープンソースで公開
  • ロードアベレージを監視して任意のコマンドを実行するコマンド - blog.nomadscafe.jp

    とあるサーバでロードアベレージが上がったときに何が起きているか知りたくなったので書いてみました。他に似たツールがあれば教えて欲しいです cpan: https://metacpan.org/release/App-LoadWatcher github: https://github.com/kazeburo/App-LoadWatcher インストール インストールはcpanmを使います $ cpanm App::LoadWatcher cpanmが入っていないなら $ curl -L http://cpanmin.us/ | perl - App::LoadWatcher とすると楽です 使い方 ロードアベレージが「0.6」以上のときにuptimeを表示するには $ load_watcher -l 0.6 -- uptime こんな感じです。ハイフン2つ書いたあとにコマンドを書きます オ

  • Commando.io - Manage servers easily online.

    BedOps with Commando.io Mobile.DOWNLOAD ON THE APP STORE Announcing execution scheduling.LEARN MORE A new "swagger" for Commando.io.READ POST Introducing the Commando.io API.LEARN MORE

  • ZABBIX-JP - Un-Official Support Page

    このサイトは統合監視ソフトウェア"Zabbix"の非公式日コミュニティサイトです。日におけるZabbixの普及を目標としています。 ZabbixはZabbix LLCにより開発され、日国内のオフィシャルサポートはZabbix Japanが提供しています。 Zabbixオフィシャルリリース(ソースコード) 6.2.3 (2022/9/21) [ダウンロード] : [リリースノート] 6.0.9 (2022/9/21) [ダウンロード] : [リリースノート] 5.0.28 (2022/9/19) [ダウンロード] : [リリースノート] 4.0.44 (2022/9/19) [ダウンロード] : [リリースノート] Zabbixオフィシャルパッケージ (rpm, deb) Zabbix LLCのZabbix 4.0、5.0、6.0オフィシャルRPM(RHEL, CentOS, SUSE

  • リソースモニタリングツール「CloudForecast」入門 - As a Futurist...

    kazeburo さんが開発をされているサーバリソースの可視化ツール「CloudForecast」ですが、個人的に使ってみていてとても使いやすいなと思っています。もっと使ってくれる人が増えるといいなと思い、自重せずに入門エントリを書いてみました。 CloudForecast って何? そもそも何なの?という話ですが、CloudForecast とはリソースのグラフ作成ツールとして有名な「RRDTool」の薄いラッパーとして作られています。記述言語は Perl ですので、Perl と RRDTool の使い方が大体分かっている人にとっては導入さえしてしまえばかなりかゆいところまで手が届く=カスタマイズが簡単かつ自由自在なツールだと思います。とりあえずのイントロとしては kazeburo さんの YAPC::Asia 2010 でのこちらのスライドをご覧頂ければと思います。 RRDTool っ

    リソースモニタリングツール「CloudForecast」入門 - As a Futurist...
  • Ganglia と Nagios: 第 1 回 Ganglia でエンタープライズ・クラスターを監視する

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    Ganglia と Nagios: 第 1 回 Ganglia でエンタープライズ・クラスターを監視する
  • Gangliaはじめました

    2. ■自⼰紹介 名前: yuzorock(ユーゾロック) http://twitter.com/yuzorock 仕事: 某インターネットポータルサイトのインフラ(サーバ)エンジニア 今⽇の話: パフォーマンス(リソース)監視とは何かという話と、そのツールでGangliaと いうのがあっておすすめですよという話。 おまけ: 初⼼者にも優しいインフラ勉強会なのでGangliaの細かい話はないです。 細かい話は後ろにつけましたので、質問あればtwitterで@yuzorockして下さい。 できればハッシュタグ#qpstudyつけて。 ⽇語の情報が少ないので使っている⽅と⾊々と情報交換したいです。 3. ■監視とは インフラエンジニアが⾏う監視には大きく分けて以下の2種類があると思います。 死活監視: サーバやNW機器がpingやsshに正常に応答するかや提供しているサービス(http 等)

    Gangliaはじめました
  • What Powers Instagram: Hundreds of Instances, Dozens of Technologies

    Welcome to the Instagram Engineering Blog, where we share insights on building and scaling our service. One of the questions we always get asked at meet-ups and conversations with other engineers is, “what’s your stack?” We thought it would be fun to give a sense of all the systems that power Instagram, at a high-level; you can look forward to more in-depth descriptions of some of these systems in

    What Powers Instagram: Hundreds of Instances, Dozens of Technologies
  • 「Nagios」「Hobbit」「ZABBIX」「Hinemos」を徹底比較 | Think IT(シンクイット)

    コストメリットを確保するオープンソース/フリーソフトウェア 近年、IAサーバの価格が非常に安価になり、LinuxWindowsを用いたシステムが普及しています。IAサーバを採用したシステムでは、ス ケールアウトを行うように設計することでハードウェアのコストメリットが生まれます。しかし管理するサーバ台数が増加してしまうため、管理コストはそれに 反して増加する傾向があります。 システム全体を効率よく管理するためには、まずサーバのハードウェアリソースやネットワーク、OS、アプリケーションなどの状態を適切に把握できる ことが重要になります。そのため、常にシステムの稼働状況のデータを収集・監視する「監視システム」が必要とされています。 大規模システムではシステムを監視するために、大手ソフトウェアベンダーが販売する統合管理ツールを用いたり、データセンターが提供する監視サービ スを利用することが一般的

  • 監視ソフトウエアをどう選ぶか

    監視ソフトウエアで何を監視するのか システム全体の稼働状況をリアルタイムに把握し、適切な運用を行うためには、システム監視ソフトウエアが必須ですが、ソフトウエアの選定に参考となるまとまった情報が少なく、個別にシステム担当者が情報収集と検証を行って選定しているのが現状です。連載では、オープンソース、商用の監視ソフトウエアをいくつか取り上げ、各ソフトウエアを機能別、種類別などで分類し、解説します。 まず、監視には、大きく分けて「死活監視」と「リソース監視」の2つがあることを知っておきましょう。 まず、死活監視では、Pingによる応答監視、プロセスの起動監視、ポートの応答監視などにより、システムやサービスが適切に稼働しているかどうかを監視します。死活監視を有しているソフトウエアは、障害検知を行い、管理者への通知やスクリプトを実行する機能もあわせて持っている場合が多くあります。死活監視により障害を

  • Comparison of network monitoring systems - Wikipedia

    The following tables compare general and technical information for a number of notable network monitoring systems. Please see the individual products' articles for further information. Name IP SLA Reports Logical Grouping Trending Trend Prediction Auto Discovery Agentless SNMP Syslog Plugins Triggers / Alerts MIB Compiler WebApp Distributed Monitoring Inventory Platform Data Storage Method License

  • モニタリングツール(監視ソフトウェア)について調べてみた - SEの走り書き

    きっかけ Instagramの設計、チューニング、運用について書かれた「Instagram Engineering • What Powers Instagram: Hundreds of Instances, Dozens of Technologies」を読んだこと IaaSの格活用開始に伴い、監視のレベル、運用について検討する機会があったこと 結論 上手く組み合わせて使うのがベスト 大手ベンダーが提供している商用ツールをベースとし、補完的にOSS統合管理ツールを使いつつ、クイックな監視項目の追加・廃止のためにシンプルなOSS特化型ツールを使うのがベストではないか。 例として、ベースはTivoli、補完的にNagios、アプリケーション視点で可視化したい値の傾向分析用にMuninを使うイメージ。 ベース部分は標準化し、その他はある程度の自由度を持って運用できるようにすることで、「安心

    モニタリングツール(監視ソフトウェア)について調べてみた - SEの走り書き
  • うちの会社のサーバー監視方法がおかしいので改善を試みた

    前回の書き込み  http://anond.hatelabo.jp/20120407162253どんな監視方法なのかをを簡単にまとめてみるうちの会社のサーバー監視方法15台くらいのwindowsサーバーに自PCからリモートデスクトップ接続する遠隔操作でイベントログやらHDD容量やらを目視チェックして全て台帳(紙媒体)に書き込む以上を全サーバーに行うと普通に毎朝1時間かかる。負荷がでかいので分散の為、若手を入れて10人くらいで順番にまわしている今後もサーバーが増える予定あり前回の書き込みの反応は大体以下のような感じだった頭おかしいwww受けるwwwwwいろいろ予想以上 これらのコメントのおかげで、おかしいのは自分の気のせいではないという事にようやく自信を持てた。とりあえず前回すぐにでもできそうな方法を方法を教えてもらったので改善できるかサーバー管理してるチームの一人に相談してみた。自分「毎朝

  • るびま

    『るびま』は、Ruby に関する技術記事はもちろんのこと、Rubyist へのインタビューやエッセイ、その他をお届けするウェブ雑誌です。 Rubyist Magazine について 『Rubyist Magazine』、略して『るびま』は、日 Ruby の会の有志による Rubyist の Rubyist による、Rubyist とそうでない人のためのウェブ雑誌です。 最新号 Rubyist Magazine 0058 号 バックナンバー Rubyist Magazine 0058 号 RubyKaigi 2018 直前特集号 Rubyist Magazine 0057 号 RubyKaigi 2017 直前特集号 Rubyist Magazine 0056 号 Rubyist Magazine 0055 号 Rubyist Magazine 0054 号 東京 Ruby 会議 11 直

  • 続・MCollectiveのインストールと動作確認 - hack in 3 minutes

    ずっと前に一度書いたMCollective、#devopsdaysで出てて、チラホラとブクマがついたりしてたのですが、いかんせん情報が古いし、インストールしてただけだしなので再度まとめてみます。 あとOrchestration的なものでいうと、自分の周りの今の状況は Aサービスは管理サーバ全台でのコマンド実行兼デプロイツールを自作している Bサービスはpssh使ってちょっと楽になった Cサービスは未だにsshでログインして頑張ってる みたいに結構バラバラで、じゃあCapistranoとかに一個決めてゴリゴリ頑張るかーというと何かちょっとそういう時代は一旦過ぎてダルくて、もう少しオペレーションフレンドリでいい感じのが無いかを模索していたところ、ちょっと見えてきた感があるのでそれも兼ねて。 特徴とかは以前のエントリに書いたから割愛。 テスト用の構成は mcollective-client, a

  • nginxの優雅な再起動 « NAVER Engineers' Blog

    こんにちは開発チームの崔珉秀と申します。 今回はnginxというウェブサーバーについて話をさせて頂きます。 nginxは最近数年の間けっこう人気が高くなっています。特によく使われているApacheやLighttpdなどのウェブサーバーと性能の面で比較することがよくありまして、優れた性能で単純なstaticファイルを転送するウェブサーバーからCGIサーバー、reverse proxyサーバーなどの様々なウェブリクエスト処理に関わる分野で導入されています。 今日はnginxの性能の比較よりもサーバーの開発者(nginx module)もしくはサーバーの運営者としてのnginxにある仕組の中で一つを紹介したいと存じます。 サーバーの開発や運営をする場合ロジックや設定などの変更により配布の後、サーバーを再起動することがあります。 その再起動の時にウェブサービスとしてリクエストの処理を続けなが

  • dstatの万能感がハンパない - (ひ)メモ

    サーバーのリソースを見るにはグラフ化は重要ですが、推移ではなくリアルタイムな状況、例えば秒単位のスパイキーな負荷を見るには、サーバー上でvmstatやiostatなどの*statファミリーを叩く必要があります。 さて、vmstatはメモリの状況やブロック数単位のI/O状況は見られますが、バイト単位のI/O状況やネットワークの送信、受信バイト数を見ることはできません。 # vmstat 1 procs -----------memory---------- ---swap--- -----io----- --system-- -----cpu------ r b swpd free buff cache si so bi bo in cs us sy id wa st 3 1 0 4724956 355452 726532 0 0 54 484 3 3 1 0 99 0 0 2 0 0 47

    dstatの万能感がハンパない - (ひ)メモ
  • HTTPで疎通やレイテンシを確認する「httping」 - 元RX-7乗りの適当な日々

    少し前に、某所のサーバ(自分たちで管理)で、通常時は問題ないのだけど、時々HTTPレスポンスで数秒かかる現象が見受けられたので、再現させるときに目視確認でひたすらHTTPリクエストが送れてレイテンシが確認できる「httping」を利用しました。 httpingは、所謂"ping"のHTTP版。HTTPリクエストでポーリングしてくれるコマンドです。ICMPは受け付けないけどHTTPはOK、そんなサーバにも監視などで使えます。 インストール Ubuntuでは、aptでインストールできました。簡単。 $ sudo apt-get install httpingこれだけです。 簡単な使い方 $ httping (URLまたはIPアドレス)で、実行可能です。以下、実行例。 $ httping http://xxx.xxx.xxx.xxx/ PING xxx.xxx.xxx.xxx:80 (http:

    HTTPで疎通やレイテンシを確認する「httping」 - 元RX-7乗りの適当な日々
  • リクエストを落とさずにnginxをアップグレードする方法とその検証

    はじめに nginxは頻繁に保守されていてどんどんバージョンが上がっていく一方で、UbuntuやWindows以外ではソースコードからビルドする方法が一般的だと思います。 nginxのバージョンアップ頻度 2011/05/10 1.0.2 2011/05/03 1.0.1 2011/04/12 1.0.0 2011/04/04 0.9.7 2011/03/21 0.9.6 nginx CHANGESより LinuxやBSDの多くのディストリビューションではNginxがパッケージリポジトリに含まれており、通常のソフトウェアインストール手法でインストールする事ができます。(Debianにおけるapt-getや、Gentooにおけるemerge、FreeBSDにおけるports、Fedora の yum、Vine Linux の apt-get など) たまにこれらのパッケージは古いものであった

    リクエストを落とさずにnginxをアップグレードする方法とその検証
  • Webアプリケーションエンジニアはノマドであれ(特定のサーバに依存しない方法) - blog.nomadscafe.jp

    弊社では毎週水曜日はノーエンジニアデーなので、最近はMacbook AirとWIMAX持って外で仕事しています。意外と快適ですが、ここで書くのはサーバの使い方の話です。 ときおり、次のような状況に遭遇することがあります。 開発環境して使っているけど、セットアップをどのように行ったか残っていないので、新サーバへ移動できない 番環境だけど、セットアップをどのように行ったかわ(ry デプロイ元/管理ツールサーバとして使っているので古いサーバだけど捨てることができない DBがどこから参照されているか管理できていないので、サーバの入れ替えが困難 コードがどこから参照が把握できていないので、容易にサーバ構成の変更ができない 椅子^H^H 一度設置したサーバの移動なんてなかなかすることないと思う人はいるかもしれないけど、サーバが何の警告もなしに突然壊れて入れ替える必要がでてくるのはもちろん、インフラ技

    nsyee
    nsyee 2011/06/28