アクセスログをできるだけいろいろ見る時のmapreduce + ニフティクラウドでのパフォーマンス { "author": "Muddy Dixon", "twitter": "@muddydixon", "place": "第2回 MongoDB JP 勉強会 in Tokyo" } 自己紹介 大学/大学院: 自然言語処理:形態素列検索・置換システム 言語発達の計算機シミュレーション(ElmanNet+SOMみたいな) 就職: 検索エンジン(の広告最適化とか コンテンツマッチエンジンの設計開発とか エンジニアサポートの中の人とか データマイニング部門個人 取り組み サービスが死ぬほど多い&&老舗なので、近代的な解析基盤が無い サービスが死ぬほど多い&&老舗なので、ログフォーマットが素敵 むりくり合わせたために、GETパラメタがカオスになってたりする ?area=0013&bus=2&e