タグ

監視と運用に関するtkmcのブックマーク (11)

  • Yahoo! JAPANの爆速連絡ツール

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、インフラを担当しています鈴木秀典です。 入社以来、数年に渡ってオークション、ショッピングなどのサービス開発、運用を担当していましたが、昨年インフラ部門に移り、今はヤフー全体のシステム監視、可視化をはじめ、オペレーションエンジニアが抱える共通的な課題の解決につとめています。 このたび、障害時の電話連絡を自動で行うシステムを構築したので、ご紹介したいと思います。 休祝日や夜間などに、営業部門からシステム担当者に連絡を取る際、なかなか担当者をつかまえられなかったり、大きなサービスの場合は、担当者を一発で引き当てられず連絡に時間をかけてしまうことがありました。 連絡を受けるシステム担当者の立場からは、少し遅れて連絡が入っていた

    Yahoo! JAPANの爆速連絡ツール
  • あなたの運用管理が十分にうまくいかないワケ

    この連載では、オープンソースの運用監視ソフトウェア「ZABBIX」ではどんなことができるのかを、実際の使い方とともに紹介していきます(編集部) システム監視の現状 最近ではきちんとした監視の下にあるシステムが増えていますが、中にはまだ、十分に監視し切れていないシステムもあるようです。今回はまず、しばしば見掛けられる不十分なシステム監視方法を取り上げ、その問題点を明らかにし、どのような対策が必要なのかを解説していきます。 現在システム運用をしている方の中には、以下のような状況にあり、思うように監視が行えていないというケースがあるのではないでしょうか。 スクリプトを自作してシステム監視 自動化はせず、人手で簡単な監視を実施 このような状況は、特に、運用に十分なコストを掛けにくい小規模や中規模の環境で、専用の監視システムを用意できない場合に発生しやすいのではないかと思います。しかし、小規模、中規

    あなたの運用管理が十分にうまくいかないワケ
  • 大規模インフラの監視システム その2 | GREE Engineering

    こんにちは。グリーのmdoi(@m_doi)です。 今回は、グリーの監視システムについて説明したいと思います。以前、こちらの記事にて、リソース監視システムの説明をさせて頂きましたが、死活監視やログ監視については語られなかったので、気になっていた方も多いと思います。ということで、今回は、グリーのインフラにおける死活監視やログ監視、アラート通知システムを紹介したいと思います。 何を使っているの? グリーでは、死活監視にNagiosを使用していました。監視システムの中では、かなり有名なソフトウェアですから、監視システムの構築に使用したことがある方も多いのではないでしょうか。プラグインも豊富に存在するので、様々な監視を行うことができます。死活監視は、このNagiosの機能をそのまま利用し、ログ監視は、Nagiosと独自に作成したエージェント及びログフィルタを連携させて行っていました。 全体のシステ

    大規模インフラの監視システム その2 | GREE Engineering
  • ソーシャルアプリ向けシステム監視運用の勘所

    Tatsuro Hisamori from DeNA Co., Ltd. discusses mbga OpenPlatform and summarizes techniques for optimizing database and application performance including using tcpdump, Wireshark, and mk-query-digest to analyze SQL queries and network traffic. He also provides examples of optimizing resources and response times by distributing applications across virtual machines and monitoring CPU usage, database

    ソーシャルアプリ向けシステム監視運用の勘所
  • RailsサーバUnicornを飼いならす! 運用時の便利技 « BPS株式会社 開発ブログ Beyond Perspective Solutions LTD.

    伊藤です。 前回ブログで紹介したRailsサーバUnicornくんを運用し始めて結構時間が経ちました。 サービスを落とさないであるとか、システムの安定性を確保するために、 ちょっとしたユーティリティを作ったり監視ソフトMonitの設定を行ったりしていました。 みなさんのお役に立つかわかりませんが、弊社でUnicornと組み合わせて運用に利用しているツールや設定をブログに掲載してみたいと思います。 もっといいやり方がありましたら、ぜひコメント欄でご紹介頂ければと思います。 ダウンしたら自動的に再起動 これはMonitで行っています。 もちろん同内容の監視ツールGodでも可能だと思いますが、以前設定した経験があって設定が楽そうだったので、Monitでやってみました。(事実楽でした) check process unicorn with pidfile "/path/to/rails/t

  • 資料を公開いたしました!(クックパッドの裏側見せます in 大阪&名古屋) - クックパッド開発者ブログ

    こんにちは。クックパッドのすみです。 去る4/2,4/3に大阪と名古屋にて「クックパッドの開発の裏側見せます」と題して講演会を開かせて頂きました。 当日は、技術部長の井原のほか、計3名のエンジニアがプレゼンさせて頂きました。 当日の資料を公開いたしますので、是非ご覧くださいませ。 最後に、大阪・名古屋の会場にご足労頂いた皆さま、 当にどうもありがとうございました! またお会いできますことを楽しみにしております。 ・清水雄太/毎日の料理を楽しみにするためのクックパッドエンジニアライフ [slideshare id=3645164&doc=random-100405232603-phpapp01] ・佐々木達也/「Hadoopの活用事例 in クックパッド」 [slideshare id=3636819&doc=20100402hadoop-100404223254-phpapp01] ・

    資料を公開いたしました!(クックパッドの裏側見せます in 大阪&名古屋) - クックパッド開発者ブログ
  • TwitterやYoutubeなど、主要サービスAPIの稼動状況を監視してくれている『API-status』 | 100SHIKI

    HOME 便利ツール(ウェブ) TwitterやYoutubeなど、主要サービスAPIの稼動状況を監視してくれている『API-status』 TwitterやYoutubeなど、主要サービスAPIの稼動状況を監視してくれている『API-status』 January 20th, 2010 Posted in 便利ツール(ウェブ) Write comment

    TwitterやYoutubeなど、主要サービスAPIの稼動状況を監視してくれている『API-status』 | 100SHIKI
  • Facebook,自社開発のログ・データ収集ソフト「Scribe」をオープンソース化

    米Facebookは米国時間2008年10月24日,同社が各種サーバーのサービス・ログを収集するために使用しているシステム・ソフトウエア「Scribe」をオープンソース・ソフトウエアとして公開したと発表した。オープンソース・コミュニティSourceForge.netのWebサイトでソースコードを提供している。 Scribeは,大量のサーバーで運用しているさまざまなサービスのログ・データをリアルタイムに集めるインフラ・ソフトウエア。同社はScribeをデータベースのメモリー使用量の監視など,多種多様な目的に使っている。日々発生する膨大な情報を集めることが可能で,拡張性が高く,ネットワークやマシンに障害が発生しても継続作動する堅牢性を備えるという。 かつて同社は,オープンソース・ソフトウエアや特定ベンダーの製品を使ってログを集めていた。しかし,大量のデータに対処可能なシステムを構築できなかった

    Facebook,自社開発のログ・データ収集ソフト「Scribe」をオープンソース化
  • 無料で使えるサーバ監視/サイト監視。SSL証明書/ドメインの有効期限チェック : Site Alert(サイトアラート)

    お知らせ 2017/01/03 xyz ドメインに対応しました ドメイン期限監視について、xyz ドメインに対応いたしました。 追加ご希望のドメインがございましたら お問い合わせ よりお気軽にご依頼ください。 2016/12/28 サーバ監視における ssh タイムアウトについて 2016/12/28(水) 00:00 頃~12/29(木) 00:00 頃の間、サーバ監視における ssh ポート (ポート22) への接続が全件タイムアウトとなり失敗として扱われる事象が発生しておりました。 上位回線において過剰な通信と判断され、外部 ssh ポートへの接続を制限したとのことでしたが、 調整の結果、ssh ポートへの制限を解除し、今後はこのような制限をかけないことで合意いたしました。 皆様にご不便をおかけしたことをお詫びいたします。 2016/12/27 システム機能追加のお知らせ SSLサー

  • ライブドア、インターネットサーバーの死活監視サービスを無償提供

    株式会社ライブドアは9月8日、インターネット上のサーバーの死活監視を行うサービス「DATAHOTELパトロール」を、同日より無償提供開始すると発表した。特別なハードウェアやソフトウェアは不要で、個人を含む、インターネットを利用したサービス提供者を対象とする。 DATAHOTELパトロールは、インターネット上に配置されたサーバーの状態を監視するサービス。ライブドアの社員が開発したオープンソース監視ソフトウェア「zither(チター)」を利用してサーバーの死活状態を監視し、ユーザーが運営するWebサイトやWebサービスに障害が起こった場合に、その状況を自動的にメールで通知する。登録と設定だけで監視をすぐ始められるのが特徴で、専門的な知識が必要となる、ツールのインストールにかかる手間を省け、管理者の負担を軽減できるという。 ライブドアでは、このサービスを無償で提供し、インターネットそのものの利用

  • takeda-soft.jp

    takeda-soft.jp 2024 著作権. 不許複製 プライバシーポリシー

  • 1