株式会社サイバーエージェント AI事業本部 2024年度エンジニア新卒研修 オブザーバビリティ研修実践編(一部社内向けの内容)
![オブザーバビリティ研修実践編](https://cdn-ak-scissors.b.st-hatena.com/image/square/fbe66a0473ae56eec7566cd197dbbe34ad862a4e/height=288;version=1;width=512/https%3A%2F%2Ffiles.speakerdeck.com%2Fpresentations%2F9a2fc11a03bf4c4e9297adcdb9f344c7%2Fslide_0.jpg%3F30271013)
株式会社サイバーエージェント AI事業本部 2024年度エンジニア新卒研修 オブザーバビリティ研修実践編(一部社内向けの内容)
2023/5/23開催「オブザーバビリティ最前線 〜 事例LTから学ぶ、オブザーバビリティの成熟度〜」
はじめに(2019.12.7構成図追加) 自宅のセキュリティを強化したいと思ってRaspberryPiで簡易防犯カメラを自作。セキュリティサービスや高価なカメラを買う前にちょっと試してみたいという方向け。 玄関前やリビング窓の不審者を検知しLINE通知させたり、LINEBot経由で好きなときに撮影させようと思う。 今回は左から右の赤線のように、カメラからストリーミングした動画をmotionというパッケージで動体検知させてLINENotifyで通知する。 将来的にはオレンジ点線のようにLINEBot経由で撮影させたい。 準備するもの ・RaspberryPi Zero WH ・カメラモジュール ・zero用カメラケーブル ※これらは事前に接続しておいてください ・RaspberryPiへRaspbianOSのインストール ・SSH接続ユーザの作成 ・LINE Notifyアクセストークン 今
◆ ネットワークエンジニアのメモ:ブログ ⇒ iPhone、キャリア契約者数、成功する働き方 ◆ ネットワークエンジニアのランチ:ブログ ⇒ ランチ、ITニュース、Cisco、Network ◆ ネットワークエンジニア 役立つ物理ツール ⇒ 構築作業や保守作業で役立つ物理アイテム ◆ サーバ技術入門:サーバの基礎をはじめから ⇒ インフラエンジニアに役立つサーバ技術解説 ネットワークエンジニアとしての Network Studyでは、これからネットワーク エンジニアになりたいと考えている方や、CCIEレベルのネットワークエンジニア になりたいと考えている方に役立つよう基礎から上級レベルまでNW技術を解説。 Network Studyの内容は、国家資格であるネットワークスペシャリストの取得や CCNA/CCNP/CCIE取得に役立つ内容に仕上げているだけではなく仕事で役立つ ようにCisco
freee では仮想マシンのインフラ監視に Mackerel を使っていますが、Kubernetes を使っているところは前例にとらわれずゼロベースで見直そうとしています。現状は Elastic Stack と Mackerel のハイブリット構成になっています。 Elastic Stack による Kubernetes モニタリングシステムの紹介 - freee Developers Blog どの SaaS を使うかを決める前に、そもそも Kubernetes の何を監視すればいいのか? というところから考え直しています。宣言的なマニフェストにより Kubernetes が自律的にあるべき状態を保ってくれるのであれば、これまでの監視とは異なってくるはずです。 監視の観点として、ここでは通知レベルを用いて次の 3 つに分類します。 None: メトリクスは収集するが通知しない Notic
監視という一種マニアックな領域を真正面から解説した貴重な本です。監視で悩む人のみならずシステム開発に携わるすべての人にオススメ。 「全然わからない。俺たちは雰囲気で監視をやっている」 自分はAWS事業本部コンサルティング部所属ということもあって、いろんなお客様にAWSインフラのコンサルティングしてます。最初のインフラ構成設計時に監視の話をすることも非常に多いんですが、 「どうしましょう。CloudWatchでいけますかね?」 「MackerelとかDatadogとかもありますが、どうしましょ。マネージドとの違いは〜」 「とりあえず、ディスク使用率80%でしきい値設定しておきましょうか。みんなそうしてますよ」 とか言っていた昔の自分に見せつけたい本、それが今回紹介する「入門 監視」。 監視設計の原則がよくわかんない メトリクスのしきい値決めるところから監視を考えてしまいがち よく考えずに、い
«Even though Borgmon remains internal to Google, the idea of treating time-series data as a data source for generating alerts is now accessible to everyone through those open source tools like Prometheus [...]» — Site Reliability Engineering: How Google Runs Production Systems (O'Reilly Media) Open Source Prometheus is 100% open source and community-driven. All components are available under the A
logwatchとは、サーバのログを解析しやすい形に変えて通知してくれる便利な監視ツールです。デフォルトの設定なら、/var/logにあるログをひと通りチェックして、サービスごとに、そして見るべきチェック項目ごとに、見やすいかたち整理してメールで通知してくれる、とても気の利いたサーバ監視ツールです。 チェックしてくれるサービスは環境によって異なると思いますが、僕の環境だとデフォルトで下記のサービスをチェックしてくれています。 たとえばApacheのaccess_logひとつとっても、手作業でチェックするのは(僕にとって)途方もない作業ですが、logwatchが届けてくれるログメールを見れば、どのIPアドレスからおかしなアクセスがあるとか、エラーレスポンスコードごとに、どのパスに対してのアクセスで何回エラーが出ているとか、ひと目でわかります。 僕みたいな素人でもこうした情報を元にすれば、不正
Cactiはepelリポジトリに格納されています。CentOS 8.X代でも一応はメンテナンスは続けられているようでダウンロードは可能です。インストールの操作例は以下の通りです。 dnf install epel-release dnf install cacti MariaDB(MySQL)への接続情報 Cactiは設定情報をMariaDBへ格納します。/etc/cacti/db.phpを閲覧し、MariaDBへの接続情報を確認します。デフォルト設定を使用したくない場合は、/etc/cacti/db.phpを編集しても差し支えございません。 # view /etc/cacti/db.php $database_type = 'mysql'; $database_default = 'cacti'; $database_hostname = 'localhost'; $database_u
こんにちは。ディレクターのエリカです。 突然ですが、Webサイトが完成するのはいつだと思いますか? サーバ上ですべての機能が動き出したとき? サイトを公開しプレスリリースを出したとき? トラフィックが増えてPVが目標値に達したとき? このように改めて考えてみると、Webサイトには完成がないということに気づきます。 だからこそ、ユーザに公開され長い長い運用フェーズがはじまると、気になってくるのがサーバなどのネットワークトラブルです。ネットワークトラブルが原因で、せっかくのPVやCVを逃したくはないですが、素人にはなかなか難しいのも事実。 「よくわからないから、ネットワークやサーバのことは全部専門の会社に任せきり」というWeb担当者も多数いらっしゃると思いますが、そこでおすすめしたいのが、「Uptime Robot」というネットワーク監視ツールです。 とても便利でしたので、今回はその詳細を解説
ソフトウェアエンジニアのための ITインフラ監視[実践]入門 (Software Design plus) 作者:斎藤 祐一郎技術評論社Amazon 大変ありがたいことに献本いただきました。実は微力ながら内容のレビューもさせていただき(書籍内でも触れていただいて大変光栄です)、だからというわけではないですが、まず最初によい本だと書いておきます! ただ、今回改めて頂いた書籍を読んでみましたので感想みたいなものを書いてみたいと思います。 いやー、しかしさいとーさん単著すごいね!!!w 見落とされがちな事を埋める 監視は大きなサービスにおいてはかならず重要視されていますが、中小規模では経験不足もあり、どうしても後手後手にまわります。まあそれでもなんとかやっていけるので、どんどんと属人、職人芸、過去の経験にたよった運用になりがちです。それは視界の狭さにつながり、実は非効率的だったり、運良く大惨事に
Zabbix2.4の安定版が、2014年9月11日にリリースされました。なんと50以上の新機能と改善が追加されたようです。今回のバージョンアップでは、特にローレベルディスカバリ関連の機能が強化が目立っています。 ローレベルディスカバリは、ネットワークインタフェースや、ファイルシステムの監視項目を自動で設定してくれるとても便利な機能です。 ただ、監視の必要のない項目が自動で設定されることもあります。Zabbix2.2では、chrootしているディレクトリがファイルシステムとして、監視項目に設定されてしまうことがありました。この場合は、自動設定された監視項目を、手動で無効にすることが必要になります。 Zabbix2.4の新機能「ローレベルディスカバリの複数フィルタ」を使えば、自動設定のフィルタを細かく設定できるようなので、このような手間を軽減できることが期待できます。 ▽ Zabbix 2.4
ZabbixでLAMPサーバの監視設定をした時のメモです。監視項目としては、システムのCPUやメモリの使用状況やディスクI/Oなどのリソース監視と Apache、MySQLなどのミドルウェアの状態監視といった基本的なものを設定しています。Zabbixの色々な機能をできるだけ使って設定してみましたので、はじめてZabbixをさわってみる方にはチュートリアルとしても参考になるかもしれませんよ。 サーバ構成アイキャッチ画像の通り Zabbixサーバ1台と LAMPサーバ1台のみの簡単な構成での設定です。 VirtualBoxの仮想サーバ上でZabbixを設定しながらメモしましたので、各設定で指定するIPアドレスがプライベートIPアドレスになっています。ご自分の環境にあわせて読替えてください。 LAMPサーバのOSとミドルウェア構成 ・CentOS6.6 ・Apache(2.2.15-39) ・M
はじめに 本ブログでは、Chefおよび、Vagrantを用いた仮想インフラの構築について取り上げてきました。今回は、構築した仮想インフラの障害監視を行う監視システムの構築方法を2回に分けて解説します。第1回は、サーバー監視ツールのNagiosのインストールから、監視対象サーバの設定方法を解説します。 なお、構築に必要なソフトウエアは、Chefを用いたLAMP開発環境の構築方法~仮想環境構築編を参考にして、インストールして下さい。また、全ての構築作業は、Chefを用いて行います。 監視サーバの構築 構築する監視サーバのベースとなる仮想マシンを作成し、HTTPサーバをインストールします。 Boxの初期化 ベースとなる仮想マシン(Box)の初期化を行います。 $ mkdir -p ~/vagrant/nagios-server && cd ~/vagrant/nagios-server $ va
サーバの負荷などの監視に使うコマンドいろいろ [参考記事] ログをリアルタイムに表示させて監視する方法 [参考記事] PHPでロードアベレージを表示させる方法 [参考記事] Cacti RRDToolを利用したサーバ監視ツール ロードアベレージ(CPU負荷状態) w または uptime ディスク使用率 df メモリ使用状況 free 起動中のタスク ps aux ロードアベレージ、メモリ使用状況、タスク(負荷順) top ディスクI/O iostat リアルタイムで見るには watch iostat iostatを利用するにはsysstatのインストールが必要です。 yum install sysstat その他いろいろ sar -u 3 10 sarとはSystem Admin Reporterの略です。 CPUやネットワーク、メモリ、ディスクなどの情報を見ることができます。 ログは日
データベースが落ち着いているので、その間に別のことに着手。 チームの監視システムがmonっつー超レガシーシステム。知っている人もいるかもしれないが、monはperl製のシンプルな監視システム。古くからあるものなんだけど「mon perl」で検索すると「もしかして: man perl」とgoogle様にも何だっけソレ?と言われてしまうかわいそうな奴(「mon monitoring tool」だとちゃんと出てくる)。なのでまあこの際だから俺が葬り去ってやる。導入したSensuのバージョンは0.12.6。GW前くらいから運用しているが今んとこ問題ない。まだ運用期間短いね。 割と長文になっちまったので、目次をば。 0. sensu概要 1. なぜsensu? 2. インストール 3. コンフィグの配置 4. プラグインについて 5. API 6. デバッグ 7. 今後の展望 0. sensu概要
複数台のサーバーやクラウド環境を組み合わせてのサービス運用においては、ログの収集方法に工夫が必要となる。こういった場合に有用なのが、さまざまなログの収集手段を提供するfluentdだ。今回はfluentdのアーキテクチャやそのインストール/設定方法、基礎的な設定例などを紹介する。 さまざまな方法でログを収集できるfluentd 今回紹介するfluentdは、Treasure Dataが開発するログ収集管理ツールだ(図1)。オープンソースで公開されており、Linuxや各種UNIXで動作する。 図1 fluentdのWebサイト ログ収集のためのソフトウェアとしてはsyslogdやsyslog-ngなどが有名だが、fluentdがこれらと異なる点としては、以下が挙げられる。 さまざまなソースからのイベントをさまざまな媒体に出力できる fluentdの大きな特徴としては、ログの収集方法やログの記
2024年4月1日より、Supership株式会社は親会社であるSupershipホールディングス株式会社に吸収合併されました。 合併に伴い、存続会社であるSupershipホールディングスは社名をSupershipに変更し、新たな経営体制を発足しました。本件に関する詳細は、プレスリリースをご確認ください。 2024年4月1日より、Supership株式会社は親会社であるSupershipホールディングス株式会社に吸収合併されました。 合併に伴い、存続会社であるSupershipホールディングスは社名をSupershipに変更し、新たな経営体制を発足しました。 本件に関する詳細は、プレスリリースをご確認ください。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く