[B! fluentd] pero1のブックマーク

fluentdとシステム設計の小ネタ - たごもりすメモ

あるいは http://yugui.jp/articles/879 へのreply。システム監視をfluentdに統合してしまうべきか否かシステム監視は分けておいた方がいいと思う。分けるべき、とまでは言わないけれど。それらの仕組みには相応の必要な機能セットがあり、それらは長い歴史の中で比較的決まった機能セットに収斂してきており、その収集・モニタリング・可視化・アラート通知など決まりきったパターンを様々な項目について停止なく行う必要がある。 Fluentdの各種プラグインを用いることで同じような機能は実現できる。そのプラグインのうち数割は自分が書いものだったりする。とはいえ各ホストのシステム監視までそこで行うことを想定して書いたかというと、もうちょっと高いレイヤでの監視・集計、つまりサービス単位などを目的としたものが多い。サーバ単位で行おうとしたときに設定が雑多なものになるのはおそらく

pero1 2014/09/03

fluentd

リンク

ログ集計／時系列DB／可視化ツールの調査結果 - Qiita

近年、自分の中で集計／可視化は Fluentd(datacounter)+Growthforecast で定番化していました。しかしプロダクトで新たに集計／可視化の要件が出てきたことと、最近可視化ツール周りで「Kibanaってなんじゃ？」「Graphiteってなんじゃ？」「Influx DBってなんじゃ？」など、このツール達は一体何なんだろう…？というのが前々から気になっていました。今回良い機会なので ◯◯は何をするものなのか？というのを一つ一つ調べてみました。いわゆる「触ってみた系」の記事なのでだいぶ浅い感じです。大分類大きく分けると、可視化ツールは以下の３つに分けられそうです。ログ収集/集計時系列DB（＋API）の担当。バックエンド側。可視化部分の担当。今回はバックエンドと可視化部分に焦点を当ててみます。バックエンド全文検索時エンジン+Restfu

pero1 2014/08/26

リンク

Fluentdとログ収集のパターン - Go ahead!

「ログを集めて保存する」と言うのは簡単だけど，ログ収集の構成にはいくつか方法があり，勉強会などでちょくちょく聞かれるので，いくつかのパターンについて書く．「俺はもうバリバリログ収集やってるぜ！」という人は多分すでに知っていることが書かれているので，タブを閉じて良い．ここではログコレクタにFluentdを想定しているが，他のログ収集プロダクトにも適用出来るはず．ただ，Fluentdはタグベースのルーティングを持ち，単体でもキューのように動作させることが可能で，既存のものより複雑な問題を解決しようとしているので，少し工夫が必要かもしれない． Fluentdそのものについては公式ドキュメントや，Fluentdとはどのようなソフトウェアなのかを参考に．クライアントから直接保存するいきなりFluentdを使わないパターン．JavaScript SDKを提供している解析サービスやモバイル端末

pero1 2014/08/01

fluentd

リンク

Googleの虎の子「BigQuery」をFluentdユーザーが使わない理由がなくなった理由 #gcpja - Qiita

「BigQueryは120億行を5秒でフルスキャン可能」は本当か？先日、kaheiさんがGoogle BigQuery（Googleクラウドの大規模クエリサービス）について、こんなエントリを書いていた。とにかくパフォーマンスがすごい。（Fluentd Meetupでの）プレゼン中のデモで、ディスクに収められた5億件のデータをSQLでフルスキャンするのに3秒しかかからない。9億件のデータを正規表現を含んだSQLでスキャンしても、7秒で終わる（これ、記憶がちょっとあいまい。もう少しかかったかも）。これには驚いた。佐藤さんがGoogleに入社して一番驚いた技術が、一般公開される前のBigQueryだったと言っていたが、その気持ちはわかる。 From Fluentd Meetupに行ってきましたこれを読んだ時、BigQueryの検索スピードについてちょっと補足したくなった。確かにFluent

pero1 2014/05/20

リンク

広告ログ解析基盤にFluentdを使っている話 - すずけんメモ

これはFluentd Advent Calendar 14日目の記事です。私は現在、VOYAGE GROUPの子会社であるadingoで、DMP cosmiの開発をしています。今日はcosmiでのfluentd利用の話をしようと思います。 DMPについて過去に勉強会でアドテクまわり及びDMPについて話したのでそれを貼っておきます。ざっというと、いい感じにいろんなログを受けいられるようにして、それらをモニタリングしながら整理して使えるようにする、という役割をもったプロダクトです。 Head First Ad Techno logy and DMP http://www.slideshare.net/suzuken/head-first-ad-techno logy-and-dmp どこで使っているかほぼ全てです。構成としてはログ収集サーバ | | out-forward (roundro

pero1 2014/01/20

fluentd

リンク

Fluentdが流行る理由がいま分かる、10の実践逆引きユースケース集 - Y-Ken Studio

ログデータを活用してビジネスに役立てようという最近のトレンドは理解できる。しかし、なぜログ収集ソフトウェアのFluentdがこれほどまで話題になるのか、不思議に感じている方もいるのではないだろうか。単にログデータを収集するならばsyslog-ngやrsyslogで十分ではないかという意見もあるだろう。それらは既存のログシステムを置き換えるプロダクトであり、Fluentdのそれとは根本的に異なる。Fluentdは、既存のログシステムに手を入れることなく新たにログの収集を行い、ストリームデータ処理を実現するプロダクトなのである。一般的にログデータはサーバの数だけ分散しており、それを定期実行処理で収集するということだけでも、なかなか骨の折れる仕事である。さらに集めるだけでなく、日々増え続けるログデータを活用できる形に加工してしかるべきデータストアに保管するということに挫折した方もいるのでは

pero1 2013/12/05

fluentd

リンク

Fluentdとはどのようなソフトウェアなのか - たごもりすメモ

Fluentd というソフトウェアがある。日本国内ではそこそこ話題になってきたが、何ができるのか、何に使うと嬉しいのか、何に使えるのか、という点について詳細をよく知らないという人もおそらくまだ多いことでしょう。なので、簡単にまとめる。 http://fluentd.org/ なお以下の個別項目ごとに書いていくが、その手前にまとめを置いておくので忙しい人はそれだけ読むとよい。インストールや設定については導入部分については日本語の記事はもう多くあるので、触れない。概要できることログの収集センサデータ等の収集汎用データ処理プロセッサとして頻出ユースケースログの収集データの集約簡単なリアルタイム集計ソフトウェアとしての特徴コアプラグイン安定性性能開発体制コミュニティぶっちゃけどうなの？まとめ現時点で、複数の場所に分散したデータや常に増え続けるデータの安全な転

pero1 2013/12/04

fluentd

リンク

Fluentdの知られていない6つのこと - Boost Your Programming!

Fluentdの知られていない6つのこと本当に知られていないかはわからないです。公式にはあまり説明されていなかったり調べてもなかなか見つからないことが多いと個人的に思ったものを集めました。機能や言葉の細かい説明は省いているのである程度使っている人が対象です。 out_copyはshallow copy Fluentdで最初に使うであろうビルドインされているout_copyプラグインですが、実はデフォルトではメッセージをdeep copyしないため意図しない結果になることがあります。 <match test> type copy <store> type record_modifier tag test.aa foo bar </store> <store> type retag tag test.bb </store> </match> <match test.{aa,bb}> ty

pero1 2013/10/26

fluentd

リンク

Fluentd、Amazon RedshiftとTableauを用いたカジュアルなデータ可視化 | SmartNews開発者ブログ

ゴクロ改め、スマートニュース株式会社の大平です。巷間では「bigdata」の活用が叫ばれて久しいですが、弊社はまだまだ小さい規模のスタートアップのため少なくともデータサイズとしてhugeなdataの活用が行える環境ではありません。であればデータの活用に対する要求が低いか、というとそうでも無く、サービスサイドでも自然言語処理や機械学習を中心としたデータ解析処理がサービスの生命線となっていますし、サービスの裏側でも戦略を立てる上で効果測定や諸々のデータの分析は非常に重要な位置を占めています。本記事では主にサービスの裏側で求められるデータ解析において、いかにカジュアルにデータを解析するか、の一例として、掲題のような組み合わせによるデータ可視化の事例を簡単にですがご紹介したいと思います。データ解析基盤を作る側の視点からすると、システムとして求められる要件は以下のようなものだと理解していま

pero1 2013/10/26

リンク

S3とFluentdを用いた効率的なログ管理 | SmartNews開発者ブログ

ゴクロの大平です。私にとって一番大事で替えの効かないミュージシャンはさだまさしさんですが、私にとってクラウドコンピューティングのサービスの中で一番大事で替えが効かないサービスはS3です。多種多様なAPIを用いて柔軟にファイルの操作が出来る事や、”99.999999999％”と謳われている高い耐障害性、S3にあるデータをElastic MapReduceやRedshiftなどを用いて手軽にデータ解析を行える基盤が提供されていることなど、あまりに便利すぎてS3の代替となるサービスを探しだすのが難しい状態です。もちろん多くのAWSユーザーが同じようにS3の便利さを享受していると思いますし、インターネット上でも多くのブログ等でその魅力が語られています。その中で本記事は既に存在する記事と似たような内容を書いてしまうかもしれませんが、弊社なりのS3の使い方についてご紹介したいと思います。なお

pero1 2013/09/08

fluentd

リンク

Kibanaってなんじゃ？（Kibana+elasticsearch+fluentdでログ解析）

前回の記事では splunk enterpriseを使ってみました。今回もログ解析プラットホームである、Kibanaを使ってみます。 Kibanaは検索などにElasticsearchを利用します。またKibanaはデータの収集にLogstashの利用を推奨しています。それぞれ以下のようなプロダクトです。 Logstash ログデータを収集し、解析して保存します。この組み合わせで使用する場合、保存先はelasticsearchになります。 Elasticsearch リアルタイムデータの全文検索や統計などをRestfulインターフェースで提供します。 Kibana データの情報を描画し、検索したりドリルダウンで情報をたどれるGUIアプリケーションです。この３つを組み合わせて使用すると便利なログ解析プラットホームが作れますよというのがKibanaの売りです。データの収集や解析を行

pero1 2013/09/08

リンク

FluentdとRiakの話 - After Coding

Fluentdは、Ruby製のログコレクタだ。コードは公開されている。様々なログを構造化して一元管理することができ、収集と解析へのハードルを大きく下げてくれる。インストールもプラグイン開発も簡単。日本語の資料も多い。その資料も様々あるが、プラグインを見るならこれが最良だと思う。必要な情報がよくまとまっており、必読といえる。 Big Data入門に見せかけたFluentd入門 from Keisuke Takahashi データの確実な転送を実現するバッファ機能については、池田大輔さんのブログが詳しい。さて、Fluentdはデータを収集してくれるが、保存はしてくれない。永続化にはデータベースが必要だ。そこで、Riak。 Basho社がスポンサードするErlang製分散型KVS。これもOSSだが、契約によって商用サービスが受けられる。これがまたエッジ立ちまくってて

pero1 2013/08/25

fluentd
riak

リンク

fluentd で集めたログを Splunk で可視化する - 技術ノート

ウェブアプリケーションのログ収集には fluentd を使うとして、集めたログを検索したりグラフ化するには、別途システムを組む必要がある。最近だと、オープンソースの Kibana というのが流行っているようで、公式ページにも紹介がある。 Free Alternative to Splunk Using Fluentd | Fluentd ここで比較対象とされている "Splunk" だけど、これを fluentd と組み合わせて使っている人は多くないようなので、軽く紹介しておきたい。 Splunkとは？商用のログ収集＆検索エンジンとしてはメジャーな製品で、独自のクエリ言語でログを検索、加工、集計、グラフ化するあらかじめダッシュボードを作っておいてPDFでレポートを送る検索条件を設定しておいてアラートを飛ばすといったことが出来るようになっている。詳しくは公式のビデオでも。 Sp

pero1 2013/08/25

リンク

Big Data入門に見せかけたFluentd入門

2013年7月5日、社内勉強会で使用した資料です（一部修正済み）。ライセンスはクリエイティブ・コモンズ・ゼロとします。ご自由にお使い下さい。ソースのPowerPointファイルはこちら => http://bit.ly/begining_fluentd_learning_big_data fluent-plugin-glusterfsはこちら => https://github.com/keithseahus/fluent-plugin-glusterfsRead less

pero1 2013/07/21

fluentd

リンク

dstatの結果をfluentdで取得して、WebSocketで送りつけるリアルタイムリソース監視アプリを作ってみた。 - from scratch

Tuppari公開記念Hackathonで作ろうとした奴を作ってみました。ごめんなさい、micro instanceなのでアクセス過多で動かない時があるかもしれません、ちょっと調整中です。リアルタイムリソース監視アプリ yosuke-furukawa/dstatwatcher · GitHub WebSocketを使ってリアルタイムにリソース監視したりログ監視したりするのは正直よくあるやつなのですが、fluentd使ってみたかったというのと、highchartを本業の方で使おうか迷った挙句、使えなかった経緯があったので、使ってみようと思って作成してみました。大体、↓の感じの流れでやってます。 Fluentdとdstatのつなぎの部分にはfluent-plugin-dstatを使用しています。 shun0102/fluent-plugin-dstat · GitHub これを使うと、d

pero1 2013/05/19

リンク

地味でつまらないログ収集をおもしろおかしく! 最強ログコレクタ「Fluentd」のチカラ

2013年になってもバズり続けている"ビッグデータ"ですが、データ分析において最も重要となるプロセスは何かというと、やはり肝心のデータを集める作業ではないでしょうか。そしてデータからビジネスに役立つ情報を高い精度で得ようとするなら、やはり母集団となるデータの量は多いに越したことはありません。中でもソーシャルネットワークやソーシャルゲーム、eコマースなどBtoCなWebサービスを提供している企業の場合、ユーザの振る舞いを記録した膨大なアクセスログは、ビジネスを展開していく上で何よりも大切な宝ものだといえます。サービスの品質を向上し、収益性を高め、競合と差別化を図っていくためには、ログから何を読み取るかが勝負の分かれ目になります。そしてログ解析の精度を高めるには、当然ながら大量のログが必要です。つまりログ収集という作業は本来、Webアプリケーションを使ったビジネスであれば最も手を抜いてはいけ

pero1 2013/03/02

fluentd
log

リンク

開発メモ#6 : ログの取り扱い : GrowthForecast, Amazon S3, Treasure Data で心労ゼロ - naoyaのはてなダイアリー

開発メモ#6 です。前回から少し間があいてしまいました。開発メモ#2 : AWS でのホスト / クラウドネイティブなデプロイ - naoyaのはてなダイアリーで書いたように、EC2 へのアプリケーションのデプロイにあたっては Elastic IP の利点を活かしてカジュアルにホストを入れ替えまくっています。ちょっとこのデプロイは慎重になりたいな、と思ったらスナップショットからインスタンスを立ち上げては切り替える、の繰り返し。この運用をしていると、スナップショットとの差分ができやすいのは chef-solo で吸収するというのが前回、前々回のはなし。もう一点問題があります。アクセスログやアプリケーションのログです。フロントエンドのサーバをあっちこっち切り替えているうちに、そのままではログが分断されてしまう。ホストを Terminate しようものならログは消失してしまいます。この

pero1 2013/02/23

log
fluentd

リンク

Fluentdで始めるリアルタイムでのログ有効活用

はじめに Fluentdは、ログを収集し格納するためのログ収集基盤ソフトウェアです。Fluentdにインプットされた、すべてのログをJSONに変換し、アウトプットします。インプットとアウトプットはモジュール化されており、モジュールを追加することでインプット元とアウトプット先を追加できるようになっています。 Fluentdは急速に知名度を高め、多くのWebサービス会社で実際に使用されるようになりました。従来のログが抱えていた問題も、Fluentdが適切な解決策となっていると認知され、かつ簡単に導入・スモールスタートできるミドルウェアであったことが大きかったと思います。本稿では、Fluentdの簡単な仕組みと導入方法、シンプルな動作事例について紹介します。対象読者システム管理者データサイエンティスト必要な環境 UNIX系OS Ruby 1.9 ログを出力する理由システム運用を始める

pero1 2013/02/15

fluentd

リンク

走れfluentd | quipped

fluentdというソフトウェアがある。読者の多くは聞いたこともないソフトウェアだろう。そりゃそうだ。AndroidとかiOSとかWindowsのように、消費者の目に毎日さらされるものとは違い、日夜静かにデータセンターで動いているソフトウェアだ。このfluentdは、もともと古橋貞之くんが、自分がはじめた会社のサービスの一部で必要となり書いたものだが、この1年半ほどで瞬く間に広まり、今では日本中のウェブサービスで導入されている。どのくらい広まっているのかと言うと、もし読者が今日はてブをチェックしたりクックパッドでレシピを探したり NAVERまとめを見てゲラゲラ笑ったり GREEのサービスで遊んだりライブドアニュースで蒼井優の動向を探ったり1 したなら、どこかでfluentdの恩恵を受けているということになる。ちなみにこの古橋くん、ゆとり世代のダメダメなピチピチな25歳の若者で、ど

pero1 2013/02/15

fluentd

リンク

はてなブックマーク

タグ

関連タグで絞り込む (16)

fluentdに関するpero1のブックマーク (31)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス