並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 14 件 / 14件

新着順 人気順

システム監視の検索結果1 - 14 件 / 14件

  • 今日から始める「システム監視」。大量トラフィックのシステムを安定して運用する知見をアソビューのSREに学ぶ - Findy Tools

    公開日 2024/08/16更新日 2024/08/15今日から始める「システム監視」。大量トラフィックのシステムを安定して運用する知見をアソビューのSREに学ぶ はじめにアソビュー株式会社では、アソビュー!という電子チケットを販売するサイトを運営しています。 システムを安定稼働させるためには、日常的にシステムの状態を監視して、問題があれば調整するというプロセスを繰り返すことが必要不可欠です。本記事では、アソビュー株式会社において、どのような体制でこの安定稼働を実現しているかということを書くことによって、同じようにシステムを安定稼働させたいと日々考えておられる方々を想定読者として、そのノウハウを共有しようと思います。 安定稼働をするために必要な要素 人間の健康管理のために必要なことシステムを安定稼働するために必要なことというのは、人間が健康に生きていくためにやっておいたほうがいいことと共通

      今日から始める「システム監視」。大量トラフィックのシステムを安定して運用する知見をアソビューのSREに学ぶ - Findy Tools
    • システム監視、何からはじめる? / What is the first step for system monitoring?

      2020/08/31開催の、Infra Study Meetup #5「企業に必要とされているインフラ技術とこれから」のLTでお話した内容です。 https://forkwell.connpass.com/event/183909/

        システム監視、何からはじめる? / What is the first step for system monitoring?
      • Microsoft、システム監視ツール「Sysmon」のLinux版オープンソースで公開

        Microsoftは10月14日(米国時間)、Windowsで提供しているシステム監視ツール「Sysmon」のLinux版「Syemon For Linux」をオープンソースとして公開した。SysmonはMicrosoftがWindowsシステムの管理者やアプリケーション開発者向けに提供しているユーティリティ「Windows Sysinternals」の一部であり、疑わしいアクティビティのログを記録して分析できるようにするコマンドラインベースの監視ツールである。Linux版Sysmonの公開は、Windows Sysinternalsの25周年を記念して行われた。 Wiondowsのユーザーは、Syemonを利用することでプロセスの開始や終了、ネットワークへの接続、デバイスへのアクセス、ファイルへのアクセスなどのログを記録できるようになる。記録したログは、Windows PowerShel

          Microsoft、システム監視ツール「Sysmon」のLinux版オープンソースで公開
        • OpenTelemetry対応でさまざまなアプリからデータを取得&追跡できるオープンソースなシステム監視・分析ツール「SigNoz」を使ってみた

          システムの状態を監視するためのツールは多数存在していますが、その中でもSigNozはメトリクス・トレース・ログというシステム観測の3本柱に対応しており、さらに「OpenTelemetry」を利用してさまざまなアプリのデータを取得できるツールとのことなので、実際に使って試してみました。 Open source APM | SigNoz https://signoz.io/ SigNozはmacOSのほか、Linuxの下記のディストリビューションで動作するとのこと。 ・Ubuntu ・Debian ・OpenSuse ・CentOS ・SUSE Linux Enterprise Server (SLES) その他のディストリビューションにおいてもDocker経由で起動することが可能とされていますが、今回はDebianを利用して進めていきます。まずは下記のコードで各パッケージを更新しておきます。

            OpenTelemetry対応でさまざまなアプリからデータを取得&追跡できるオープンソースなシステム監視・分析ツール「SigNoz」を使ってみた
          • SREが明かす!システム監視における動的閾値設定の適応例 / 開発者向けブログ・イベント | GMO Developers

            お疲れ様です。技術ブログを久しぶりに投稿します。SREチームのキム・ドンヒョンです。 SREチームは、信頼性の高いシステムを提供するため、様々な活動を通じてシステムをサポートしています。その中でもシステムの監視と通知活動は、SREチームの重要な業務の一つです。今回は、サービスの安定性を確保するための重要な活動の一つである閾値設定について詳しく説明します。 基本的な監視と閾値設定 基本的なシステムの監視は、システムのパフォーマンスが特定の閾値を超えたり下回ったりしたときに警告を発することです。こうした監視により、システムは自己フィードバックを受けて安定した正常状態を保つことができます。例えば、エアコンのように室内温度を一定に保つ必要があるシステムでは、温度が一定の範囲を外れるとイベントを発生させたり、必要な動作を行ったりしてシステムの安定性を維持します。このような閾値設定は、システムの特性に

            • 今日から始めるPrometheusによるシステム監視(1) 〜Prometheusの特徴とアーキテクチャ〜 | さくらのナレッジ

              この記事は2021年3月6日に行われたオープンソースカンファレンス 2021 Online/Springにおける発表を文章化したものです。 今回は「今日から始めるPrometheusによるシステム監視」ということで、Prometheusというツールについてご紹介をしていこうかなと思います。皆さんに「Prometheus完全に理解した」と言えるようになっていただきたい、というのが今回の目標です。 本連載は3本で構成されていて、それぞれ以下の内容を扱います。 Prometheusの特徴とアーキテクチャ(この記事) PrometheusとCNCF、Observability Prometheusを使ってみよう Prometheusとは Prometheus(プロメテウス)は、SoundCloudという海外の音楽系サービスのエンジニアによって開発された監視システムです。もともと、Kubernete

                今日から始めるPrometheusによるシステム監視(1) 〜Prometheusの特徴とアーキテクチャ〜 | さくらのナレッジ
              • AI活用実践記#02:SREによる生成AI活用 — システム監視の効率化に挑む

                生成AIの活用が急速に広がり、さまざまな場面で導入されるようになってきました。私たちMIXIでも、業務の効率化やユーザー体験の向上に向け、生成AIの活用を積極的に進めております。本連載では、そうした取り組みのなかから、社内で実際に導入・運用しているAI活用事例をピックアップし、現場目線でご紹介しています。 第一弾では、開発本部データグループにおけるGitHub Copilotの利用状況の可視化とGitHubの活動要約について取り上げました(記事)。第二弾となる今回は、SRE(Site Reliability Engineering)グループが取り組んでいる「Dashboard Analyzer」というプロジェクトを紹介します。 このプロジェクトは、システムの健全性を日々確認するためのダッシュボード監視業務に、生成AIによる要約・解釈を組み込むことで、作業の手間を減らし、確認観点の精度向上に

                  AI活用実践記#02:SREによる生成AI活用 — システム監視の効率化に挑む
                • プログラマーやシステム監視はムッツリスケベには向いてない

                  Errorがエッロ!!!に見えてしまうから むっつりだからダレにも相談できない

                    プログラマーやシステム監視はムッツリスケベには向いてない
                  • 今日から始めるPrometheusによるシステム監視 / Starting system monitoring with Prometheus today

                    オープンソースカンファレンス2021 Online/Springにて、セミナープログラムとしてお話しました。 https://event.ospn.jp/osc2021-online-spring/session/298458

                      今日から始めるPrometheusによるシステム監視 / Starting system monitoring with Prometheus today
                    • 今日から始めるPrometheusによるシステム監視(3) 〜Prometheusを使ってみよう〜 | さくらのナレッジ

                      ここでちょっと注意していただきたいのが、リリースされているものを見ると、Latest-releaseとPre-releaseがあります。Pre-releaseはβ版、いわゆる初期リリースみたいなものですので、基本的にはLatest-releaseの方を使っていただければと思います。 各アーキテクチャごとにバイナリが用意されていますので、今回はlinux-amd64というものを使用します。アーカイブのURLをコピペしてきまして、wgetで手元にダウンロードします。wgetはすぐ終わるので、ダウンロードしてきたファイルをtarで解凍します。そうするとディレクトリができ上がるので、そこを見ていくと、こんな感じでファイルが展開されます。 $ wget https://github.com/prometheus/prometheus/releases/download/v2.25.2/prometh

                        今日から始めるPrometheusによるシステム監視(3) 〜Prometheusを使ってみよう〜 | さくらのナレッジ
                      • 「Sysmon 14.0」が公開、マルウェアの検知・解析だけでなくブロックも可能に/Windows Sysinternalsのシステム監視ツール

                          「Sysmon 14.0」が公開、マルウェアの検知・解析だけでなくブロックも可能に/Windows Sysinternalsのシステム監視ツール
                        • サイバートラスト、システム監視ソフト「Zabbix」の延長サポートサービスを提供

                            サイバートラスト、システム監視ソフト「Zabbix」の延長サポートサービスを提供
                          • 機械学習システム 監視入門 - Qiita

                            初期構築時は問題なく動作しますが、数ヶ月~数年が経つと、売れる商品、顧客の購入傾向、ものが売れる仕組みも徐々に変化していく為、前半の①②と比較し、後半の ③機械学習モデルよる予測や推定 と ④その結果を活用 は環境変化の影響を大きく受け、実用に耐えない状況となってしまいます。 つまり、ビジネス環境変化に対し静的な、(A)一般的なシステム開発での要素(①データ取得、②前処理)と共に、ビジネス環境変化に対し動的で大きく影響を受ける(B)機械学習システム特有の要素(③モデルの学習と予測、④予測結果の活用)の両者をいかに監視し、環境変化を捉えて先手で対策を打つか?が重要となります。 環境変化による影響の波及 コンセプトドリフトやデータドリフトといった環境変化が精度劣化を引き起こしますが、その環境変化はこの機械学習システムのどこに影響を及ぼすでしょうか?普通に考えると、「③学習と予測」 にのみ影響が

                            • 今日から始めるPrometheusによるシステム監視(2) 〜PrometheusとCNCF、Observability〜 | さくらのナレッジ

                              Prometheusは、CNCF(Cloud Native Computing Foundation)という組織のプロジェクトの1つとしてホストされています。Linux Foundationをご存じの方も多いかと思いますが、CNCFはこのLinux Foundation配下の組織の1つでして、クラウドネイティブなオープンソースのプロジェクトを推進する組織です。クラウドネイティブないろんなソフトウェアをどんどん使っていこうね、それがどんどん成熟するように推進していくよ、後押ししていくよう手伝うよ、というようなコミュニティがCNCFです。 実はPrometheusは、このCNCFの2つ目のGraduated Project(グラデュエーテッド・プロジェクト)です。Graduated Projectとは何かというと、いわゆる「卒業プロジェクト」というふうによく言われます。 CNCFのプロジェクト

                                今日から始めるPrometheusによるシステム監視(2) 〜PrometheusとCNCF、Observability〜 | さくらのナレッジ
                              1