米国を中心に、オンライン処理はMongoDB、バッチ処理はHadoopという組み合わせが非常にポピュラーになってきている印象である。従来からMongoDB Connector for Hadoopを使うことでHadoopからMongoDBに直接アクセスすることは可能だったが、つい先日、単なる MongoDBのデータ(BSONフォーマットのファイル)がHadoopから読み込めるようになった(また、HadoopのoutputとしてBSON 形式のファイルを使用することも同時に可能になった)。 これはMongoDBのデータベースファイルではなく、mongodumpを使ってダンプされる純粋なBSONファイルであることに注意が必要だ。つまり、HadoopがBSONファイルを読むときには、MongoDBで設定したインデックス等は使用されない。単にデータの塊があり、そのフォーマットがBSONである場合で