運用監視も エンジニアが対応 これまでの経験を元に、お客様の業務を全面的にサポート。運用監視もエンジニアによる24時間体制で状況変化・障害発生を早期に検知し、対応します。 幅広い対応力 技術担当者が不在、または別の業務に専念したい場合も、ハートビーツのエンジニアがインフラ管理〜コンサルティングまで対応、ご要望にお応えします。
OSS運用監視ソフト 注目の10製品徹底比較 2016年版:実際に検証済み!OSS徹底比較(1)運用監視編(1/8 ページ) 運用監視をはじめ、多くの企業が取り入れているOSS(オープンソースソフトウェア)。目的に応じて最適なものを選択し、うまく使いこなせば強力な武器となるが、それができなければかえって手間や混乱の原因にもなりかねない。本連載では注目のOSSをピックアップして実際に検証し、基本的な優位性、劣位性を明確化した。ぜひOSSを選ぶ際の参考にしてほしい。 2014年9月、「徹底比較! 運用監視を自動化するオープンソースソフトウェア10製品の特徴、メリット・デメリットをひとまとめ」を公開してから1年半が経過している。その間にもシステムの利用規模は拡大を続けており、それとともに肥大化する運用業務の効率化は急務となっている。 「OpenStack」や「Docker」などIaaS/PaaS
Nagiosマン、Nagiosガールのみなさん、こんにちは。 あなたは何台のNagiosを見てますか? どうやら私の部署では両手で足りない数のNagiosを抱えているということがわかりました。 Nagiosも数が増えてくると管理が大変で、こんな有様になりがちです。 最近これをこんな状態にしてだいぶ楽になりました。 こんな素晴らしいThrukの導入方法を紹介します。 Thrukとは 公式の説明は、Thruk Introductionにあります。 (日本語訳) Thrukは多種類の監視サービスのWebインターフェースとなるものです。 現在は、Livestatus APIを通して、Naemon,Nagios,Ichinga,Shinkenをサポートしています。 『ドロップイン』であるようにデザインされて、大規模環境およびユーザビリティ向上のためにオリジナルのほとんど100%の機能をカバーし、さら
さまりっか 対お姉ちゃん用監視部隊、通称Shinken隊の話をしようじゃないか。 Shinken: http://www.shinken-monitoring.org/ 一応先に結論から言っておくと、対お姉ちゃん用監視部隊としても普通の監視ツールとしても決して使い勝手はよくありません。 Shinken is 何 真剣?マジなの?おこなの? http://en.wikipedia.org/wiki/Shinken_%28software%29 Python製の監視フレームワークちゃんです。 WebUIおよび切り替え機能付(Thruk, MK Multisite, NagVis or PNP) カスタマイズダッシュボード有り 影響度可視化画面有り nagios互換(ダウンタイム設定とかもある) HA機能有り pnp4nagios/Graphite連携可 DBは割と選べる(MySQL, Orac
はじまりはじまり みんなAdagiosって知ってる?nagiosのフロントエンドなんだけど!これこれ! http://adagios.org/ 超モダンでかっこいいWebUIを持ってて、もう「え?nagios?ダサくない?」なんて言わせないぜ! バックエンドにはicingaとかshinkenを使うことも出来るので、nagiosおよび互換監視エンジン向けWebフロントエンドと言う認識で良いと思います。 構成 トポロジ: | Ansible | --- | SW | --- | Adagios | Ansible: $ cat /etc/lsb-release DISTRIB_ID=Ubuntu DISTRIB_RELEASE=14.04 DISTRIB_CODENAME=trusty DISTRIB_DESCRIPTION="Ubuntu 14.04 LTS" Adagios: $ cat
Incident Intelligence and Automation Collaboration, Communication and Analysis Automation Platforms Notifications | Business Messaging Ticketing Data Warehousing | Business Intelligence Runbook Runbook Workflow Orchestration ITOps and DevOps Data Changes Change Management +CMDB Change CI/CD Observability | Monitoring System Log Cloud Synthetic | Real User Specialized Mobile Network Application Tim
muninに辛くなってfabricでなんやかんやするアプリケーションを作ったりしていたがグラフ描画部分で辛くなり、色々と調べた結果InfluxDBとGrafanaの組み合わせが良さそうだったので、それでいい感じにリソース可視化してみたという内容。 概要 監視サーバーと監視されるサーバー群が存在していて、監視サーバーにInfluxDB、Grafana、Fabricをインストールする。 監視サーバーはFabricで各サーバーにssh接続しメトリックを取得する。取得したメトリックはInfluxDBに保存され、Grafanaで可視化される。という感じ。 Versions OSはCentOSでやったけどInfluxDBとGrafanaのインストールと起動が違うだけだと思われる。 InfluxDB = 0.8.8(stable) Grafana = 2.0.1 Fabric = 1.10.1 infl
こんにちは。インフラストラクチャー部の加藤(@EugeneK)です。 今回はWebサービスを運用する上で欠かせない、モニタリングをクックパッドでどうしているかという話をします。 死活監視と性能監視 Webサービスを運用している以上、そのサービスを稼働しているサーバがあり、サーバには故障やトラブルが発生します。 また、どれくらいのパフォーマンスが出ているか、リソースをどのくらい消費しているかなどのトレンドを把握することは、成長するサービスを支えていく上で欠かせません。 故障やトラブルにいち早く気づくための仕組みを死活監視と言います。 また、サーバリソースの時系列での推移を知るために、グラフとしてトレンドを可視化する仕組みを性能監視と言います。 ポーリング監視の限界とZabbixのアクティブ監視 クックパッドでは死活監視にNagios、性能監視にMuninを使用してきましたが、サーバ台数の増加
いつもアプリケーションの開発ばかりで、まじめに監視系を考えたことがなかったので、 fluentdを中心にした監視系を作ってみた。 前提 複数台のアプリケーションサーバ 一台のログ収集サーバ ログにはエラーログとアクセスログの大きく2種類を用意する エラーログは更に複数のレベルでファイル単位にわかれている fatal error warn アプリケーションサーバとログ収集サーバは同一ネットワーク上にある やりたいこと メールで来ても絶対に気がつかない自信がある。 異常の側から教えてくれる仕組みを目指す。 fatalログが出た場合は、電話による通知を行う 全てのエラーログはchatツールに出力する ログのバックアップ ログの分析・可視化 この記事では1, 2, 3についてまとめる。 構築 fluentdのインストール 公式のドキュメントが一番わかり易い。 Installation | Flue
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く