2020/08/31開催の、Infra Study Meetup #5「企業に必要とされているインフラ技術とこれから」のLTでお話した内容です。 https://forkwell.connpass.com/event/183909/
タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。
Microsoftは10月14日(米国時間)、Windowsで提供しているシステム監視ツール「Sysmon」のLinux版「Syemon For Linux」をオープンソースとして公開した。SysmonはMicrosoftがWindowsシステムの管理者やアプリケーション開発者向けに提供しているユーティリティ「Windows Sysinternals」の一部であり、疑わしいアクティビティのログを記録して分析できるようにするコマンドラインベースの監視ツールである。Linux版Sysmonの公開は、Windows Sysinternalsの25周年を記念して行われた。 Wiondowsのユーザーは、Syemonを利用することでプロセスの開始や終了、ネットワークへの接続、デバイスへのアクセス、ファイルへのアクセスなどのログを記録できるようになる。記録したログは、Windows PowerShel
システムの状態を監視するためのツールは多数存在していますが、その中でもSigNozはメトリクス・トレース・ログというシステム観測の3本柱に対応しており、さらに「OpenTelemetry」を利用してさまざまなアプリのデータを取得できるツールとのことなので、実際に使って試してみました。 Open source APM | SigNoz https://signoz.io/ SigNozはmacOSのほか、Linuxの下記のディストリビューションで動作するとのこと。 ・Ubuntu ・Debian ・OpenSuse ・CentOS ・SUSE Linux Enterprise Server (SLES) その他のディストリビューションにおいてもDocker経由で起動することが可能とされていますが、今回はDebianを利用して進めていきます。まずは下記のコードで各パッケージを更新しておきます。
お疲れ様です。技術ブログを久しぶりに投稿します。SREチームのキム・ドンヒョンです。 SREチームは、信頼性の高いシステムを提供するため、様々な活動を通じてシステムをサポートしています。その中でもシステムの監視と通知活動は、SREチームの重要な業務の一つです。今回は、サービスの安定性を確保するための重要な活動の一つである閾値設定について詳しく説明します。 基本的な監視と閾値設定 基本的なシステムの監視は、システムのパフォーマンスが特定の閾値を超えたり下回ったりしたときに警告を発することです。こうした監視により、システムは自己フィードバックを受けて安定した正常状態を保つことができます。例えば、エアコンのように室内温度を一定に保つ必要があるシステムでは、温度が一定の範囲を外れるとイベントを発生させたり、必要な動作を行ったりしてシステムの安定性を維持します。このような閾値設定は、システムの特性に
この記事は2021年3月6日に行われたオープンソースカンファレンス 2021 Online/Springにおける発表を文章化したものです。 今回は「今日から始めるPrometheusによるシステム監視」ということで、Prometheusというツールについてご紹介をしていこうかなと思います。皆さんに「Prometheus完全に理解した」と言えるようになっていただきたい、というのが今回の目標です。 本連載は3本で構成されていて、それぞれ以下の内容を扱います。 Prometheusの特徴とアーキテクチャ(この記事) PrometheusとCNCF、Observability Prometheusを使ってみよう Prometheusとは Prometheus(プロメテウス)は、SoundCloudという海外の音楽系サービスのエンジニアによって開発された監視システムです。もともと、Kubernete
急成長中のSaaS企業「Datadog」(ティッカーシンボル:DDOG)が上場申請書類を公開しました。 Datadogの創業コンビはどちらもフランスの名門大学「エコール・セントラル・パリ」出身。CEOのOlivier Pomel氏は在学中に万能メディア再生ツール「VLCメディアプレイヤー」開発に携わっていたエンジニアで、卒業後はIBMのR&D部門へ。そこで先輩のAlexis Lê-Quôc氏と出会い、教育スタートアップ「Wireless Generation」(後にNews Corpが買収)での協業した後2010年にDatadogを設立しました。 様々なシステムで発生するデータを一元管理する分析プラットフォームとしてスタートし、2012年からはインフラ監視ツールをリリース。これまでIndex VenturesやICONIQ Capitalなどの著名ベンチャーキャピタルから累計で1.48億ド
はじめに こんにちは。ZOZOテクノロジーズBtoB開発部の三好です。 今回はServerlessなシステムの監視、保守、運用を行う中で、これまでやってきたことや、その反省点などを紹介します。マネージドサービスでの開発・運用で同じ苦悩をされている、もしくはこれからマネージドサービスを利用して構築する方々の参考になれば幸いです。 サービス紹介 私の所属するBtoB開発部は、Fulfillment by ZOZO(以下FBZ)を提供しています。FBZはZOZOBASEと自社EC、店舗の在庫を一元化し、在庫切れの無い世界を実現するためのサービスです。 その中で、ZOZOBASEと自社ECをつなげるためのデータ連携API開発を担っています。 なぜ監視をするのか 私たちは、日々APIが正常に稼働しているか、不正なデータが発生していないかを監視してます。マネージドなサービスを使って、Serverles
ここでちょっと注意していただきたいのが、リリースされているものを見ると、Latest-releaseとPre-releaseがあります。Pre-releaseはβ版、いわゆる初期リリースみたいなものですので、基本的にはLatest-releaseの方を使っていただければと思います。 各アーキテクチャごとにバイナリが用意されていますので、今回はlinux-amd64というものを使用します。アーカイブのURLをコピペしてきまして、wgetで手元にダウンロードします。wgetはすぐ終わるので、ダウンロードしてきたファイルをtarで解凍します。そうするとディレクトリができ上がるので、そこを見ていくと、こんな感じでファイルが展開されます。 $ wget https://github.com/prometheus/prometheus/releases/download/v2.25.2/prometh
「がとらぼ」の中の人の環境は、インターネットに公開するサービスを提供するサーバは基本的にFreeBSD、LAN内の自分専用機材はLinuxという住み分け。逆もそれぞれ少しずつ混じってるけど。 で、LAN内のLinuxは、PCで動いているもの以外に、シングルボードコンピュータが数枚。それらは「がとらぼ」でも記事を書いたRaspberry Pi ZeroWとかNanoPi NEO/NEO2とかOrangePiとかエトセトラ・エトセトラ・エトセトラ。(ユル・ブリンナー風) 動かす機材が増えるとLANであっても監視するようにしておかないと、知らない内に停まってたり、リソースが不足して調子が悪くなってたりで困ることに。ホストに仕込んでいるシステム監視用エージェントのNode Exporterは簡単にシステムの各種情報を拾ってくれるが、シングルボードコンピュータ(Linux)のメトリクス値の元ネタの在
閾値監視の限界 情報システムの安定稼働には、ネットワーク、ハードウェア、ソフトウェアなどシステムの構成要素を総合的に監視し、サービスの中断やビジネスへの影響につながりかねない障害をいち早く検知して対応することが不可欠である。 多くの情報システムでは「統合監視ツール」を導入し、システムを構成する各コンポーネントのリソース使用状況やログを監視して、障害検知を実行している。動的に推移するリソースの使用状況やアプリケーションのパフォーマンス監視方法としては、監視対象のメトリック(計測値)ごとに閾値を設定し、その閾値を上回る(または下回る)場合にアラートを発報する「閾値監視」が一般的である。 しかし閾値監視には次のような課題がある。 ・ 閾値を超えて初めて異常を検知するため、性能の段階的劣化など、メッセージを伴わないサイレント障害を早期に検知できない。 ・ 監視対象のメトリックはその時々のサーバー負
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く