[B! monitoring] ilyaletreのブックマーク

オブザーバビリティ（可観測性）がなぜ必要だと考えるのか - YAMAGUCHI::weblog

はじめにこんにちは、Stackdriver担当者です。本記事は完全に個人の意見です。（念押し） GCP的に担当製品がわかりやすいのでStackdriverの担当と書いてますが、仕事での担当領域的には「オブザーバビリティ (Observability、可観測性)」です。この「オブザーバビリティ」という言葉が近年SREの文脈で語られることが増え、また今年に入って「入門監視 ("Practical Monitoring" の日本語訳)」が刊行されたことで、日本でもより多く耳にするようになりました。 SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム発売日: 2017/08/12メディア: 単行本（ソフトカバー）入門監視 ―モダンなモニタリングのためのデザインパターン作者:Mike Julian発売日: 2019/01/17メディア:

ilyaletre 2019/09/12

設計過程で責任の境界作ると自然と境界の向こうがブラックボックスになっちゃう。だけどそこで一歩踏みとどまって観測用のポートを開ける設計を続けないといけないんだなー。

リンク

監視について思うとこ - y-ohgi's blog

TL;DR 監視はユーザーにサービスを提供できているかを観測するための行為 SLI/SLOを定めて、SLOを守れるようにモニタリングするダッシュボードは定常的に表示しておくものと障害時に活用するものを作ると良いアラートはレベル分けして人間が対応しなければならないものだけ人間へ通知する監視とはサービスを健全に動作させ続けるために監視を行います。「健全に動作している」の定義はサービスによって異なり、ユーザーにWebページを見せることができることだったり、バッチが正常に終了することだったりします。最終的にユーザーに正常にサービスを提供できていることを観測するために行うことに変わりはありません。さてユーザーにサービスを提供するために何を監視しましょうか？クラウド前提であれば個人的にリソースベース（CPU/Memory）より、 SLI/SLOをベースに監視する事が望ましいと考えてい

ilyaletre 2019/08/25

リンク

delightworks-tech-night-1

モンスターストライクのマスターデータのローカライズ運用について / Operation of Monster-Strike master data localization /

ilyaletre 2019/03/19

ログを1/100でサンプリングしてるくらいでも有意義な使い方ってなんだろ。監査証跡には使えないし、トラブルシュートにもきかないし。

monitoring

リンク

モニタリングシステムの Push 型 Pull 型アプローチと Prometheus についての考察 - def yasuharu519(self):

この記事はFOLIOアドベントカレンダー16日目の記事です。昨日の記事は @u_nationによるFlux+ViewModel(AAC)+Daggerで画面回転対応してみたでした。 Push v.s. Pull モニタリングシステム、と一言で言っても死活監視やメトリクス監視といろいろあるものの、モニタリングシステムの議論の中で、そのモニタリングシステムが採用している方法が、 Push 型アプローチなのか Pull 型アプローチなのかについて議論になることがあります。また、最近採用事例も増えている監視システムである Prometheus は Pull 型のアプローチがとられています。Push 型、Pull型、それぞれでどういう特徴があるのかについてもちょっと気になったので調べてみました。 Push 型アプローチとは Push 型のアプローチでは、監視対象となるホストにエージェントをイン

ilyaletre 2019/02/21

serviceに対するヘルスチェックはPull型にしたいなー

リンク

入門監視を読んで、「監視の民主化」に本気で向き合おうと思った話 - コネヒト開発者ブログ

こんにちは！待ちに待った2月です。何を待っていたか？フットボールネーション（１３） (ビッグコミックス)やブルーピリオド（４） (アフタヌーンコミックス)、BLUE GIANT SUPREME（７） (ビッグコミックススペシャル)が発売される月ということになります。嬉しい〜！の金城(@o0h_)です。さて。 (ほぼ)ちょうど1ヵ月前に出た「入門監視」は、いろいろな方面で話題になりました。既に色々な書評やまとめが出回っていて、反響の大きさが感じられますね！ www.oreilly.co.jp 弊社でも、会社の書籍購入補助を利用して即予約 & 入手をしました。この本からは非常に多くの学びや示唆を得られたと感じています。先日、その内容・感じたことを、社内LT会で共有しました。発表内容を踏まえつつ、読後に自分なりに考えさせられたことをまとめてみたいと思います。ただしスライドに含

ilyaletre 2019/02/19

組織に対する思いが熱い。障害対応とかは人々の特性も絡みやすいし、やっぱり組織での取り組みの話とかになるんだなー、と。

monitoring

リンク

JMX で快適モニタリング環境を作ろう - Cybozu Inside Out | サイボウズエンジニアのブログ

こんにちは、アプリケーション基盤チームの青木(@a_o_k_i_n_g)です。今回は Java アプリケーションのモニタリング等で活躍する JMX について記します。JMX を用いれば、きめ細やかでかつ手軽にモニタリングすることができます。もちろんサイボウズが提供するクラウドサービス cybozu.com でも JMX を活用して日々モニタリングを行っています。モニタリングの重要性については今さら言うまでもありません。一方で現実のモニタリングは何かと手間がかかったり属人化してしまったりすることがありがちです。JMX は銀の弾丸ではありませんが、少なくともメトリクスの収集・提供部分に関しては利便性を提供してくれます。JMX ユーザーが少しでも増えるよう、この記事で紹介させていただきます。 JMX とは JMX とは Java Management Extensions の略称で、Java

ilyaletre 2018/09/28

リンク

LINEのマイクロサービス環境における分散トレーシング - LINE ENGINEERING

By LINE Engineering | 2014.09.25 2021.01.08LINE Engineering Blog official account LINEとマイクロサービス LINEのアプリは、トークをはじめとして、電話、ショップ、公式アカウントなど、多数のサービスで構成されていますが、これらのサービスはモノリシックな単一のシステムとして開発されているわけではありません。それぞれ独立したシステムとして開発・運用され、お互いにAPIを介してコミュニケーションする、いわゆるSOAやマイクロサービスと呼ばれるアーキテクチャになっています。本エントリでは、大規模なマイクロサービス環境において、システムのトレーサビリティを向上させるためのLINEバックエンドの取り組みを紹介します。マイクロサービスの課題最近よく耳にするマイクロサービスですが、その利点は、システムを扱いやすい小

ilyaletre 2018/09/14

リンク

Kubernetes上のアプリケーションログを自動収集する - Qiita

TL;DR; 新サービスや既存サービスをKubernetesに移行するたびに、ログの収集設定のためインフラエンジニア待ちになってしまうのは面倒ですよね。そこで、アプリのログをFluentdとDatadog LogsやStackdriver Loggingで自動的に収集する方法を紹介します。主に以下のOSSを利用します。 fluentd kube-fluentd fluent-plugin-datadog-log fluent-plugin-google-cloud 今回はDatadog Logsを使いますが、Stackdriver Loggingを使う場合でもUIやAPIクレデンシャル等の設定以外は同じです。お急ぎの方へ: アプリ側の設定手順標準出力・標準エラーログを出力するだけでOKです。参考: The Twelve-Factor App （日本語訳）詳しくは、この記事の「サ

ilyaletre 2018/09/14

こういう知見がほしかった

monitoring

リンク

Testing in ProductionとMonitoring Driven Developmentについて調べたまとめ | DevelopersIO

Testing in ProductionとMonitoring Driven Developmentについて調べたまとめサーバーレス開発部の阿部です。今日はサーバーレス開発のテストにつきまとう課題について調べていたらたどり着いた言葉であるTesting in ProductionとMonitoring Driven Developmentを取り上げてみようと思います。【背景】サーバーレス開発のテストにつきまとう課題以前、Serverless ArchitectureとMicroservice Architectureの違いに触れた時に、Serverless Architectureの特徴としてマネージドサービスを使い倒すことをあげました。マネージドサービスは便利なのですが、使い倒すという観点になるとこれがなかなかに曲者です。以前サーバーレス開発部の和田もこのような記事を書いてお

ilyaletre 2018/09/10

リンク

可観測性とマイクロサービス

Spring BootによるAPIバックエンド構築実践ガイド第2版何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

ilyaletre 2018/08/20

リンク

Prometheus 監視で変わるもの

2017/01/19 にあった『【freee×プレイド】Tech Meetup 〜インフラ監視編〜』の LT 発表資料です。Read less

ilyaletre 2018/06/05

なんかこう監視の可視化ってサービスの仕様を決めるのと似ていて、あれもこれもって入れると何も得られないんだなって。何を捨てるかを考える方が有用。

リンク

Pull doesn't scale - or does it? | Prometheus

Let's talk about a particularly persistent myth. Whenever there is a discussion about monitoring systems and Prometheus's pull-based metrics collection approach comes up, someone inevitably chimes in about how a pull-based approach just “fundamentally doesn't scale”. The given reasons are often vague or only apply to systems that are fundamentally different from Prometheus. In fact, having worked

ilyaletre 2018/06/05

prometheusのブログどれも面白いんだけどなにこれ。。。

リンク

Logs and Metrics and Graphs, Oh My! | Grafana Labs

Solutions All end-to-end solutions Opinionated solutions that help you get there easier and faster

ilyaletre 2018/05/29

リンク

graphiteの時系列データをpandasとscikit-learnで予測して月次レポート化する仕組み

こんにちはCTOの馬場です。弊社では業種柄、サーバごとのCPU利用率などたくさんの時系列メトリックデータを持っています。以前はこの収集・閲覧にcactiを利用していましたが、最近はgrafana + graphiteを利用しています。 (ちなみにこれらは全て自社製OSS監視エージェントのhappo経由で収集されます) 今回はこのデータの活用例として弊社で実装している解析・レポーティングについて簡単に紹介します。できること全体としては月次レポートを作るしくみです。月次レポートを自動生成月次レポートに、前月の実績値が閾値超過しているグラフを掲載月次レポートに、前月の実績値からの予測値が1ヶ月以内に閾値超過するグラフを掲載下2つは今回作ったgraphdというアプリケーションで実現しています。 ※オレンジが閾値、赤が予測動作概要ハートビーツでは HTTPS(HTTP)+JSON

ilyaletre 2017/08/03

線形回帰と言われて解らないのが悔しい。勉強したい。

リンク

Re: ゼロから始める監視設計

世間では、情報システムの運用・監視の「自動化」というキーワードがもてはやされがちで、各種のツール・プロダクト等が出てくる昨今です。しかし、「自動化」の実態は深い霧のベールに包まれていると感じていませんか。今回は、以下の現場視点でこのベールを脱がしてみたいと思います。 July Tech Festa 2016 発表資料 #jtf2016 平成28年7月24日(日)Read less

ilyaletre 2016/07/26

リンク

はてなブックマーク

タグ

関連タグで絞り込む (12)

monitoringに関するilyaletreのブックマーク (15)

お知らせ

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス