おまけに久しぶりに発表までしてきました。 資料→ ざっくり内容を書いておくと mongodbは固定フォーマットではないデータをとりあえず投入して構造化できるので、解析初期に非常に便利 mongoimportは標準入力でいけるので、hadoop/hiveのstreamingと相性いい mongoimportは標準入力でいけるので次のようにフィルタをかませられる $ cat access.log | perl ./filter.pl | mongoimport -d mydb -c mycollection --fields ip,timestamp,method,host,uri,useragent mongodbのmapreduceはkey/valueを縦横無尽に検索したり集計したりできるので、解析初期に便利 mongodbのmapreduceはhadoopのそれと比べると、sort&sh