タグ

HiveとFluentdに関するhohoho_ho2005のブックマーク (3)

  • 2種類のログ解析基盤 - wyukawa's diary

    僕は仕事では2種類のログ解析基盤を見ています。 1つ目はどちらかというとエンジニアよりの解析基盤でサービス側のエンジニアがShib, ShibUIを通して好きにクエリを投げることができます。ただしtableをcreateしたりdropしたりinsertしたりはできません。selectのみです。データの更新作業は別途cronのhive batchで行います。データはFluentd経由で各サービスのサーバーから収集します。こっちのシステムは古くからあって僕は引き継いだだけなので見ているとはいってもそんなにやることは無いですし、語れることも少ないです。 2つ目は約1年前に僕が一から構築したシステムでプランナーよりのシステムになってます。僕のチーム内のエンジニアだけがrawデータを触ったり更新したりすることができて、プランナーはレポートを通して加工されたデータを見る形になります。なので1つ目のシス

    2種類のログ解析基盤 - wyukawa's diary
  • OSSで支えられるライブドアの巨大ログ集計 ~ HiveとFluentd ~

    2012年8月18日に開催された「第2回NHNテクノロジーカンファレンス」での講演です。 登壇者 田籠 聡 (tagomoris) 氏 NHN Japan株式会社 ウェブサービス部 概要: ライブドアブランドがもつ多数のWebサービスのアクセスログを相手に、どのようにログを収集し保存し、またそれをどのように集計・分析しているか、誰でも使えるためにどのような仕組みを用意しているか、などについての全体像をお話します。 全面的にOSSとして公開されているソフトウェアを使用しているため誰でも同じ仕組みを作れる のだ、ということを楽しみにお聞きいただけると思います。

    OSSで支えられるライブドアの巨大ログ集計 ~ HiveとFluentd ~
  • 第2回NHNテクノロジーカンファレンスでしゃべってきた - たごもりすメモ

    勤務先が主催でNHNテクノロジーカンファレンスという技術者向けイベントをやってるんだけど、その登壇者として社外の誰かから推薦されたらしいので(何故……)、ひとセッションしゃべってきた。なお「HBase at LINE」の発表は「HBaseについて誰かいない?」と主催の伊勢さんに聞かれたのに自分が推薦しました。みんなありがたがるといいよ。 他の人の話も、懇親会でのあれやこれやも大変楽しかった。HBaseなー、火山かー、みたいな。そのうち techblog にまとめエントリが上がるんじゃないでしょうか。それまでこっちでも見ると当日の状況が多少なりわかるかもしれません。 第2回NHNテクノロジーカンファレンス #nhntech まとめ - Togetterまとめ で、自分がしゃべったときのスライドはこちら。(slideshareのembed用タグを埋めてもはてなダイアリーに弾かれてしまう…… 対

    第2回NHNテクノロジーカンファレンスでしゃべってきた - たごもりすメモ
  • 1