[B! fluentd] asonasのブックマーク

Happy Elements Labs: fluentdとMongoDBでユーザー行動を見える化

はじめにエンジニアの@ryooo321です。よろしくお願いします。今回は弊社で運用中の全アプリで利用している行動分析プラットフォームについてご紹介したいと思います。 2012年の6月に作ってから、約9ヶ月ほど運用しています。特徴・手がかからないデータストア・さまざまな問い合わせ対応で利用できる柔軟なクエリ・機敏なMap/Reduceによる集計・集計結果をCSVやグラフで可視化目的・ユーザーの問い合わせに効率的に対応し、アプリの企画・開発に集中するため・ユーザーの行動を抽象化・可視化することでPDCAの質を向上させるため行動ログのフロー 1. ユーザーからRuby on Rails製のソーシャルゲームにリクエスト 2. Railsからローカルのfluentdにログ出力(fluent-logger-ruby) 3. ローカルのfluentd

asonas 2013/03/25

リンク

走れfluentd | quipped

fluentdというソフトウェアがある。読者の多くは聞いたこともないソフトウェアだろう。そりゃそうだ。AndroidとかiOSとかWindowsのように、消費者の目に毎日さらされるものとは違い、日夜静かにデータセンターで動いているソフトウェアだ。このfluentdは、もともと古橋貞之くんが、自分がはじめた会社のサービスの一部で必要となり書いたものだが、この1年半ほどで瞬く間に広まり、今では日本中のウェブサービスで導入されている。どのくらい広まっているのかと言うと、もし読者が今日はてブをチェックしたりクックパッドでレシピを探したり NAVERまとめを見てゲラゲラ笑ったり GREEのサービスで遊んだりライブドアニュースで蒼井優の動向を探ったり1 したなら、どこかでfluentdの恩恵を受けているということになる。ちなみにこの古橋くん、ゆとり世代のダメダメなピチピチな25歳の若者で、ど

asonas 2013/02/15

fluentd

リンク

fluent-plugin-redeliverというのを書いた

昔からとうてい世間に公表出来ないようなものばっかり作っていた私ですが、今年の目標に「パブリックにリリース出来るもの(製品およびライブラリ)をたくさん作る」と掲げておりまして、その第一弾というわけではないですが今をときめくイベントログ収集ツールのFluentのプラグインを書きました。名前はredeliverプラグインです。ログに別のタグをつけて再送するんです。必要に迫られて作った感じなんですが、一応作る前にそもそもそういうプラグインありそうじゃね? って思って探してみたりはしました。するとそれっぽいものとしてrewriteプラグインとrewrite-tag-filterプラグインが見つかりました。あら…どちらの作者も名字は違うけどKentaroさんなんですね…ってそれはおいておいて、残念ながらドキュメント読んでみると微妙にぼくの使い方に合致しないため使えませんでした。ぼくが必要としてい

asonas 2013/01/17

fluentd

リンク

超初級！Fluentdのプラグインを書きたくなった時の下地づくり · さよならインターネット

January 5, 2013 fluentdをまともに動かしたことないけどプラグイン書いたらわかるのでは！！？と思い立って取り敢えず下地だけつくったのでメモ。参考 fluentdのためのプラグインをイチから書く手順(bundler版) / tagomorisのメモ置き場 Writing plugins / fluentd fluent-plugin-imkayac / fujiwara fluent-plugin-r18 / studio3104 基本はもりす先生の手順にそって行えば問題なし。参考にオフィシャルのドキュメントと @fujiwaraさんのシンプルなプラグイン @studio3104さんの下地を見ながら書くとなおよし。また、rake testまで通したものを https://github.com/kenjiskywalker/fluent-plugin-hoge こ

asonas 2013/01/05

リンク

pullreqを通して @kentaro さんに教わったこと - Studio3104::BLOG.new

ある日あんちぽさんからこのようにありがたいメッセージを頂戴しました。 @すたじおなんとかさん URL 2012-11-28 15:14:06 via Twitter for Mac fluent-plugin-flatten腐ってるらしいけど、すたじおなんとかさんのぷるれくで治る予定です 2012-11-28 15:11:38 via Twitter for Mac 「out_flattenみたいなことしたかったら、自分だったらout_exec_filterでやるなー」という発言をしたのですが、そのこと根に持ってイヂワルしてくるシクシクと思っていました。しかし、全然そんなことではありませんでした。 @fujiwaraさんのfluent-plugin-suppressを参考に*1させていただきつつ実装してpullreqし、最終的にはMergeしていただいたのですが、その過程で色々なことを

asonas 2012/12/12

fluentd

リンク

Fluentular: a Fluentd regular expression editor

Regular Expression Test String Custom Time Format (See also ruby document; strptime) Example (Apache) Regular expression: ^(?<host>[^ ]*) [^ ]* (?<user>[^ ]*) \[(?<time>[^\]]*)\] "(?<method>\S+)(?: +(?<path>[^ ]*) +\S*)?" (?<code>[^ ]*) (?<size>[^ ]*)(?: "(?<referer>[^\"]*)" "(?<agent>[^\"]*)")?$ Time Format: %d/%b/%Y:%H:%M:%S %z

asonas 2012/11/15

リンク

知見はblogエントリに書けという話、またはWeb業界における @oranie 消失のリスク - たごもりすメモ

このエントリに書くことはほとんど与太話なのであまり真面目に受け取ってはいけない。特定のツール/ソフトウェア/業界であれこれやっていてTwitterに何となく書いたりしていると、かなり詳しい人からダイレクトに反応があって議論が進み仕事も進んでみんなハッピー、ということがある。自分だけじゃなくて、割と周囲を見てても起きてるなーと思う。特に、だいたい詳しい人とかはそれぞれお互いのやりとりも見てるので、後日になって「あの人とあの人がこんな話を」というと、みんなけっこう覚えてて、ああお仕事の役に立ってますね、ソーシャルネットワーク万歳！となる。が、これ、実際あまりよくない。tweetは流れちゃって後から追いにくいし、その時に両方をfollowしてないと会話が追えないし、まとめて集積されないと多少その道に詳しい人でないと全体像をとらえるのが難しかったりする。これらの問題は特にできたばかりのソ

asonas 2012/10/24

リンク

Apacheのサンプルログを生成し続けるスクリプト

最新の記事はこちらです。 Fluentdのテストをする過程で欲しかったので、Apacheのログを生成し続けるスクリプトを書きました。と言っても生成部分はTreasureDataのスクリプトを丸ぱくりで流量制限をするオプションを追加して延々と出力するようにしただけです。 frsyuki++。手元でサクッとproductionで確認できる人はうらやましす。使い方は以下のような感じです。詳細はREADMEを見てください。 ruby sample_apache_gen.rb [--rate=0] [--limit=0] [--rotate=0] [--progress] [--json] [outfile] --rate 毎秒何レコード生成するかの指定。0以下は制限無し。 --limit 最大何件出力するか。0以下は延々と出力し続ける。 --rotate ローテーションの間隔。単位は秒指定。

asonas 2012/10/17

リンク

こまけぇこたぁいいんだよ！！

asonas 2012/10/11

fluentd

リンク

検証中のtd-agent（fluentd）の設定とか負荷とか - mikedaの日記

せっかくなのでアクセスログ関連のところだけ抜き出してみます。構成概要 Fluentdを使ってWEBサーバ（APPサーバ）のアクセスログを集約サーバに集約、いくつかの処理をやってます。要するにこの3つです。まとめてファイルに保存する（とりあえずやってみてるだけ） TreasureDataプラットフォームにデータを送信して集計可能にする Zabbixでサービスの稼働状況を可視化する TreasureDataプラットフォームに関しては前の記事で書いたように、簡単な管理画面を作って集計テストをしています。自社フレームワーク用のライブラリも作成するつもりです。 Zabbixを使った可視化はこんな感じです。プラグインの構成図 td-agentはサーバごとに1プロセス、できる限りシンプルでFluentdっぽい使い方を心がけてます。負荷 2億/dayくらいのログを突っ込んでみたところ、集約サー

asonas 2012/10/04

リンク

Treasure Dataの解析プラットフォームを使ってみた - mikedaの日記

ログの解析は日時でscpでかき集めてバッチ集計してるんだけどリアルタイムで集計したいもっと柔軟に集計したいという人は多いんじゃないでしょうか。リアルタイム収集はFluentdを使えばいけそうですが、集計部分を柔軟にというとどうだろう。 CookpadやAmebaはHiveを使ってるとの情報がある。『Hive on AWS @ COOKPAD』『Amebaのログ解析基盤』（どっちも古い。HiveはHadoop上でSQL（っぽく）ログ解析するためのプロダクトです）「面白そうだなー。でもHadoopよくわからん、というかサーバいっぱいいりそうだから承認通すのめんどくさい(´・ω・｀)」とか思ってたらSoftwareDesignの最新号にこんな記事が。 Cookpadの人「Treasure Dataは...ログ解析用の商用プラットフォームを提供しています。 Fluentd経由で

asonas 2012/10/04

リンク

zusaar.com - zusaar リソースおよび情報

This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

asonas 2012/10/01

高まる

fluentd

リンク

Fluentdで収集したログのHTTPステータスコードを集計し、結果をGrowthForecastでグラフ化する - FAT47の底辺インフラ議事録

最近個人的にいろいろ弄っているFluentdでまた記事をかきます。これからやること。 (1) Fluentdで収集したApacheログをGrowthForecastでグラフ化 (2) fluent-plugin-datacounterを利用して、ログのHTTPステータスコードのチェックと集計を行い、結果をfluent-plugin-growthforecastでグラフ化 Fluentdの説明と導入記事は前回の記事で。 Apacheログをfluentd+Mongo DBで収集しRubyで集計 GrowthForecastの導入も前回の記事から。様々な値をWebAPI経由でグラフ化できる「GrowthForecast」をインストールしてみたまず (1)Fluentdで収集したApacheログをGrowthForecastでグラフ化 GrowthForecastのWebAPIを叩いてくれるf

asonas 2012/09/27

リンク

【作業メモ】Apacheログをfluentd+MongoDBで収集しRubyで集計してみたが… - FAT47の底辺インフラ議事録

ものすごく流行の波に乗り遅れた感がありますがfluentd入れてみました。 fluentdとは作者の古橋さんのブログから引用 http://d.hatena.ne.jp/viver/20110929/p1 - fluent は syslogd のようなツールで、イベントログの転送や集約をするためのコンパクトなツールです。ただ syslogd とは異なり、ログメッセージにテキストではなく JSON オブジェクトを使います。またプラグインアーキテクチャを採用しており、ログの入力元や出力先を簡単に追加できます。 - ログを素敵な感じで別サーバに転送、集約することが可能です。ログはJSON形式で構造化されているのでログデータが利用しやすいのも特徴です。手順 ※前提としてapacheが稼働済みであるとします fluentdインストール yumでさくっと vim /etc/yum.re

asonas 2012/09/27

fluentd

リンク

dstatの結果をfluentdで取得して、WebSocketで送りつけるリアルタイムリソース監視アプリを作ってみた。 - from scratch

Tuppari公開記念Hackathonで作ろうとした奴を作ってみました。ごめんなさい、micro instanceなのでアクセス過多で動かない時があるかもしれません、ちょっと調整中です。リアルタイムリソース監視アプリ yosuke-furukawa/dstatwatcher · GitHub WebSocketを使ってリアルタイムにリソース監視したりログ監視したりするのは正直よくあるやつなのですが、fluentd使ってみたかったというのと、highchartを本業の方で使おうか迷った挙句、使えなかった経緯があったので、使ってみようと思って作成してみました。大体、↓の感じの流れでやってます。 Fluentdとdstatのつなぎの部分にはfluent-plugin-dstatを使用しています。 shun0102/fluent-plugin-dstat · GitHub これを使うと、d

asonas 2012/09/27

リンク

fluentdのtailプラグインを使ってログを収集してみる

Mongo DBのReplica SetsをUbuntuで試してみる | shinodogg.comで立てた Mongo DBにApacheのログを突っ込みたいわけなんですが、何かとFluent(https://github.com/fluent/fluentd)がアツそうなので試してみます。 ↓こちらのブログを参考にさせていただきました。イベントログ収集ツール fluent を試しに使ってみる | 文字 ■ fluentdのインストール RubyGemsを使ったインストールをしてみます。諸事情で自分のUbuntuはまっさらな状態になったので、Ruby入れて、RubyGems入れてから、 # apt-get install ruby1.8 # apt-get install rubygems gem用にプロキシの設定を入れてやって # vi ~/.gemrc http_proxy: ht

asonas 2012/09/12

fluentd

リンク

tjun月１日記

コロナウイルスが流行する前の2020年1月上旬、中国の杭州に行ってきたのでその記録を書いておく。はじめに自分はこれが中国へ行くの5回目。それなりに慣れている方だと思うけど、中国人と一緒に行ったほうが圧倒的に楽です。数年前にキャッシュレスが普及して、その後も規制が変わったりして行くたびに状況が変わっています。なので、ここで書いてあることは半年後には参考にならないかも。事前にやっておくこと WeChatPayのアカウントを作る、可能なら本人確認とチャージをやっておく Alipayのアカウントを作って、可能なら本人確認とチャージをやっておく中国で使える香港SIMを買う WeChatPayとAlipayのアカウントは、外国人でも作れるときと作れないときがある。またお金もチャージできるときとできないときがある。事前にググってできるかどうか試しておくのが重要。また、中国はいわゆるGrea

asonas 2012/09/12

リンク

統合ログ管理基盤としてのFluentdを試してみました。

先日、朝ご飯を家で食べてきたにも関わらず、通勤途中の駅のカレー屋さんの匂いに誘惑され、朝カレーしました！周りのメンバーにはこの幸せがまったく響かなかったのが残念です。アライドアーキテクツの唯一のインフラ基盤エンジニアの平野です。「からあげ朝カレー」というメニューでした。さて今回のお題は、インフラ界隈で盛り上がりを見せているFluentdという技術についてです。私ももれなくこの技術に注目し、先日もFluentd Meetup in Japan #2 に参加させていただいたり、自社のシステム合宿で、周りのメンバーが粛々とプログラムをしている横でFluentdをいじり倒してました。 ◇背景昨今ビッグデータ、ビッグデータと注目され、Webサービスにおけるユーザの行動解析、即時性のあるマーケティングデータの抽出要望がシステムに課せられます。 NoSQLと呼ばれる大量データを分散処理に

asonas 2012/08/31

fluentd

リンク

fluentdを使ってnginxのログを溜めてみるメモ - zakihayaメモ

まずはローカルのファイルにログをためてみる fluentdインストール td-agentというパッケージを使う。参考 Installing td-agent for Redhat and CentOS / Installing td-agent daemon / Knowledge Base - Treasure Data Platform Support [root@localhost ~]# vim /etc/yum.repos.d/td.repo [root@localhost ~]# cat /etc/yum.repos.d/td.repo [treasuredata] name=TreasureData baseurl=http://packages.treasure-data.com/redhat/$basearch gpgcheck=0 [root@localhost ~]

asonas 2012/08/31

fluentd

リンク

EC2インスタンス上でnginxのログをfluentd経由でS3へ飛ばしてみる - nozaq's diary

このエントリでEC2インスタンスにfluentdをインストールした続き. EC2インスタンスのAMIはUbuntu Server Cloud Guest 11.10 64Bitを使用. nginxをインストール公式ドキュメントを参考に, apt-get用リポジトリにnginxを追加. > cd work_dir # 適当な作業ディレクトリへ異動 > wget http://nginx.org/keys/nginx_signing.key > sudo apt-key add nginx_signing.key > sudo vi /etc/apt/sources.list ファイル末尾に下記リポジトリを追加. deb http://nginx.org/packages/debian/ squeeze nginx deb-src http://nginx.org/packages/debi

asonas 2012/08/31

リンク

はてなブックマーク

タグ

関連タグで絞り込む (21)

fluentdに関するasonasのブックマーク (44)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス