タグ

monitoringに関するilyaletreのブックマーク (15)

  • オブザーバビリティ(可観測性)がなぜ必要だと考えるのか - YAMAGUCHI::weblog

    はじめに こんにちは、Stackdriver担当者です。記事は完全に個人の意見です。(念押し) GCP的に担当製品がわかりやすいのでStackdriverの担当と書いてますが、仕事での担当領域的には「オブザーバビリティ (Observability、可観測性)」 です。この「オブザーバビリティ」という言葉が近年SREの文脈で語られることが増え、また今年に入って「入門 監視 ("Practical Monitoring" の日語訳)」が刊行されたことで、日でもより多く耳にするようになりました。 SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム 発売日: 2017/08/12メディア: 単行(ソフトカバー) 入門 監視 ―モダンなモニタリングのためのデザインパターン 作者:Mike Julian発売日: 2019/01/17メディア:

    オブザーバビリティ(可観測性)がなぜ必要だと考えるのか - YAMAGUCHI::weblog
    ilyaletre
    ilyaletre 2019/09/12
    設計過程で責任の境界作ると自然と境界の向こうがブラックボックスになっちゃう。だけどそこで一歩踏みとどまって観測用のポートを開ける設計を続けないといけないんだなー。
  • 監視について思うとこ - y-ohgi's blog

    TL;DR 監視はユーザーにサービスを提供できているかを観測するための行為 SLI/SLOを定めて、SLOを守れるようにモニタリングする ダッシュボードは定常的に表示しておくものと障害時に活用するものを作ると良い アラートはレベル分けして人間が対応しなければならないものだけ人間へ通知する 監視とは サービスを健全に動作させ続けるために監視を行います。 「健全に動作している」の定義はサービスによって異なり、ユーザーにWebページを見せることができることだったり、バッチが正常に終了することだったりします。 最終的にユーザーに正常にサービスを提供できていることを観測するために行うことに変わりはありません。 さてユーザーにサービスを提供するために何を監視しましょうか? クラウド前提であれば個人的にリソースベース(CPU/Memory)より、 SLI/SLOをベース に監視する事が望ましいと考えてい

    監視について思うとこ - y-ohgi's blog
  • delightworks-tech-night-1

    モンスターストライクのマスターデータのローカライズ運用について / Operation of Monster-Strike master data localization /

    delightworks-tech-night-1
    ilyaletre
    ilyaletre 2019/03/19
    ログを1/100でサンプリングしてるくらいでも有意義な使い方ってなんだろ。監査証跡には使えないし、トラブルシュートにもきかないし。
  • モニタリングシステムの Push 型 Pull 型アプローチと Prometheus についての考察 - def yasuharu519(self):

    この記事はFOLIOアドベントカレンダー16日目の記事です。昨日の記事は @u_nationによるFlux+ViewModel(AAC)+Daggerで画面回転対応してみたでした。 Push v.s. Pull モニタリングシステム、と一言で言っても死活監視やメトリクス監視といろいろあるものの、モニタリングシステムの議論の中で、そのモニタリングシステムが採用している方法が、 Push 型 アプローチなのか Pull 型 アプローチなのかについて議論になることがあります。 また、最近採用事例も増えている監視システムである Prometheus は Pull 型のアプローチがとられています。Push 型、Pull型、それぞれでどういう特徴があるのかについてもちょっと気になったので調べてみました。 Push 型アプローチとは Push 型のアプローチでは、監視対象となるホストにエージェントをイン

    モニタリングシステムの Push 型 Pull 型アプローチと Prometheus についての考察 - def yasuharu519(self):
    ilyaletre
    ilyaletre 2019/02/21
    serviceに対するヘルスチェックはPull型にしたいなー
  • 入門監視を読んで、「監視の民主化」に本気で向き合おうと思った話 - コネヒト開発者ブログ

    こんにちは!待ちに待った2月です。 何を待っていたか? フットボールネーション(13) (ビッグコミックス)やブルーピリオド(4) (アフタヌーンコミックス)、BLUE GIANT SUPREME(7) (ビッグコミックススペシャル)が発売される月ということになります。 嬉しい〜!の金城(@o0h_)です。 さて。 (ほぼ)ちょうど1ヵ月前に出た「入門 監視」は、いろいろな方面で話題になりました。 既に色々な書評やまとめが出回っていて、反響の大きさが感じられますね! www.oreilly.co.jp 弊社でも、会社の書籍購入補助を利用して即予約 & 入手をしました。 このからは非常に多くの学びや示唆を得られたと感じています。 先日、その内容・感じたことを、社内LT会で共有しました。 発表内容を踏まえつつ、読後に自分なりに考えさせられたことをまとめてみたいと思います。 ただしスライドに含

    入門監視を読んで、「監視の民主化」に本気で向き合おうと思った話 - コネヒト開発者ブログ
    ilyaletre
    ilyaletre 2019/02/19
    組織に対する思いが熱い。障害対応とかは人々の特性も絡みやすいし、やっぱり組織での取り組みの話とかになるんだなー、と。
  • JMX で快適モニタリング環境を作ろう - Cybozu Inside Out | サイボウズエンジニアのブログ

    こんにちは、アプリケーション基盤チームの青木(@a_o_k_i_n_g)です。 今回は Java アプリケーションのモニタリング等で活躍する JMX について記します。JMX を用いれば、きめ細やかでかつ手軽にモニタリングすることができます。もちろんサイボウズが提供するクラウドサービス cybozu.com でも JMX を活用して日々モニタリングを行っています。 モニタリングの重要性については今さら言うまでもありません。一方で現実のモニタリングは何かと手間がかかったり属人化してしまったりすることがありがちです。JMX は銀の弾丸ではありませんが、少なくともメトリクスの収集・提供部分に関しては利便性を提供してくれます。JMX ユーザーが少しでも増えるよう、この記事で紹介させていただきます。 JMX とは JMX とは Java Management Extensions の略称で、Java

    JMX で快適モニタリング環境を作ろう - Cybozu Inside Out | サイボウズエンジニアのブログ
  • LINEのマイクロサービス環境における分散トレーシング - LINE ENGINEERING

    By LINE Engineering | 2014.09.25 2021.01.08LINE Engineering Blog official account LINEとマイクロサービス LINEのアプリは、トークをはじめとして、電話、ショップ、公式アカウントなど、多数のサービスで構成されていますが、これらのサービスはモノリシックな単一のシステムとして開発されているわけではありません。それぞれ独立したシステムとして開発・運用され、お互いにAPIを介してコミュニケーションする、いわゆるSOAやマイクロサービスと呼ばれるアーキテクチャになっています。 エントリでは、大規模なマイクロサービス環境において、システムのトレーサビリティを向上させるためのLINEバックエンドの取り組みを紹介します。 マイクロサービスの課題 最近よく耳にするマイクロサービスですが、その利点は、システムを扱いやすい小

    LINEのマイクロサービス環境における分散トレーシング - LINE ENGINEERING
  • Kubernetes上のアプリケーションログを自動収集する - Qiita

    TL;DR; 新サービスや既存サービスをKubernetesに移行するたびに、ログの収集設定のためインフラエンジニア待ちになってしまうのは面倒ですよね。 そこで、アプリのログをFluentdとDatadog LogsやStackdriver Loggingで自動的に収集する方法を紹介します。 主に以下のOSSを利用します。 fluentd kube-fluentd fluent-plugin-datadog-log fluent-plugin-google-cloud 今回はDatadog Logsを使いますが、Stackdriver Loggingを使う場合でもUIAPIクレデンシャル等の設定以外は同じです。 お急ぎの方へ: アプリ側の設定手順 標準出力・標準エラーログを出力するだけでOKです。 参考: The Twelve-Factor App (日語訳) 詳しくは、この記事の「サ

    Kubernetes上のアプリケーションログを自動収集する - Qiita
    ilyaletre
    ilyaletre 2018/09/14
    こういう知見がほしかった
  • Testing in ProductionとMonitoring Driven Developmentについて調べたまとめ | DevelopersIO

    Testing in ProductionとMonitoring Driven Developmentについて調べたまとめ サーバーレス開発部の阿部です。 今日はサーバーレス開発のテストにつきまとう課題について調べていたらたどり着いた言葉であるTesting in ProductionとMonitoring Driven Developmentを取り上げてみようと思います。 【背景】サーバーレス開発のテストにつきまとう課題 以前、Serverless ArchitectureとMicroservice Architectureの違いに触れた時に、Serverless Architectureの特徴としてマネージドサービスを使い倒すことをあげました。 マネージドサービスは便利なのですが、使い倒すという観点になるとこれがなかなかに曲者です。以前サーバーレス開発部の和田もこのような記事を書いてお

    Testing in ProductionとMonitoring Driven Developmentについて調べたまとめ | DevelopersIO
  • 可観測性とマイクロサービス

    Spring BootによるAPIバックエンド構築実践ガイド 第2版 何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。このでは、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

    可観測性とマイクロサービス
  • Prometheus 監視で変わるもの

    2017/01/19 にあった『【freee×プレイド】Tech Meetup 〜インフラ監視編〜』の LT 発表資料です。Read less

    Prometheus 監視で変わるもの
    ilyaletre
    ilyaletre 2018/06/05
    なんかこう監視の可視化ってサービスの仕様を決めるのと似ていて、あれもこれもって入れると何も得られないんだなって。何を捨てるかを考える方が有用。
  • Pull doesn't scale - or does it? | Prometheus

    Let's talk about a particularly persistent myth. Whenever there is a discussion about monitoring systems and Prometheus's pull-based metrics collection approach comes up, someone inevitably chimes in about how a pull-based approach just “fundamentally doesn't scale”. The given reasons are often vague or only apply to systems that are fundamentally different from Prometheus. In fact, having worked

    Pull doesn't scale - or does it? | Prometheus
    ilyaletre
    ilyaletre 2018/06/05
    prometheusのブログどれも面白いんだけどなにこれ。。。
  • Logs and Metrics and Graphs, Oh My! | Grafana Labs

    Solutions All end-to-end solutions Opinionated solutions that help you get there easier and faster

    Logs and Metrics and Graphs, Oh My! | Grafana Labs
  • graphiteの時系列データをpandasとscikit-learnで予測して月次レポート化する仕組み

    こんにちはCTOの馬場です。 弊社では業種柄、サーバごとのCPU利用率などたくさんの時系列メトリックデータを持っています。 以前はこの収集・閲覧にcactiを利用していましたが、最近はgrafana + graphiteを利用しています。 (ちなみにこれらは全て自社製OSS監視エージェントのhappo経由で収集されます) 今回はこのデータの活用例として弊社で実装している解析・レポーティングについて簡単に紹介します。 できること 全体としては月次レポートを作るしくみです。 月次レポートを自動生成 月次レポートに、前月の実績値が閾値超過しているグラフを掲載 月次レポートに、前月の実績値からの予測値が1ヶ月以内に閾値超過するグラフを掲載 下2つは今回作ったgraphdというアプリケーションで実現しています。 ※オレンジが閾値、赤が予測 動作概要 ハートビーツでは HTTPS(HTTP)+JSON

    graphiteの時系列データをpandasとscikit-learnで予測して月次レポート化する仕組み
    ilyaletre
    ilyaletre 2017/08/03
    線形回帰と言われて解らないのが悔しい。勉強したい。
  • Re: ゼロから始める監視設計

    世間では、情報システムの運用・監視の「自動化」というキーワードがもてはやされがちで、各種のツール・プロダクト等が出てくる昨今です。しかし、「自動化」の実態は深い霧のベールに包まれていると感じていませんか。今回は、以下の現場視点でこのベールを脱がしてみたいと思います。 July Tech Festa 2016 発表資料 #jtf2016 平成28年7月24日(日)Read less

    Re: ゼロから始める監視設計
  • 1