[B! hadoop][log] aki77のブックマーク

aki77 id:aki77

hadoopとlogに関するaki77のブックマーク (2)

HadoopによるApacheのログ解析の実際
こんにちは、ミツバチワークス stoneです。今日は、DECOLOGで行われている、Apacheのログ解析について、ご紹介してみようかと思います。現在、DECOLOGでは、リバースプロキシが8台あって、その8台の1日のApacheのログは、全部で、200Gバイト以上になっています。これを、13台のHadoopのスレーブノードで解析を行っています。全体の流れとしては、 1) リバースプロキシからHDFSにログを転送 2) 解析用のサーバーで、HDFSにログの転送が終わるのを監視 3) ログの転送が終わったら、Hadoopを起動、解析 4) Hadoopの解析結果をデータベースに保存以下では、各々のステップを個別に見て行くことにしますね。 1. リバースプロキシからHDFSにログを転送当初、Hadoopのプロセスが立ち上がっていないと、HDFSにはアクセスできない、と思い込ん
aki77 2011/01/28
hadoop

apache

log
リンク
『Hadoop/Hiveを用いたログ解析基盤の構築』
こんにちは。Amebaのログ解析基盤を担当しているICHIROです。今回は構築・運用中のログ解析基盤「Patriot」について書きたいと思います。 Webサービスを運営していると日々大量のログデータやユーザデータが蓄積されます。今まではPV（ページビュー）やUU（ユニークユーザ）などアクセスログなどから取れる、大枠の指標のみを見ることがほとんどでした。ページビューに合わせてシステムを増強するなど、システム側としては十分とも言える指標ですが、広告や課金サービスという視点から見ると十分とは言えません。今まではAmeba内の個々のサービス担当者が必要とする指標を出すためにアプリエンジニアやDB エンジニアに都度依頼をする形でデータを抽出していました。今後の課金サービスの発展が見込まれ、よりデータ分析の重要性が高まると考えた私は、エンジニアでないサービス担当者（主にプロデューサ）がより簡単
aki77 2011/01/06
hadoop

log
リンク
1