通常hadoopの処理結果は part-00000 ファイルにすべて書かれる。 ほとんどの場合それで問題ないが、時には処理結果を複数に分けたいこともある。 たとえば、解析結果を日付ごとに出力したいとかよく起こりそうだ。 そういった場合、Hadoop 0.19.0 から導入された MultipleOutputs を使うと便利。 下のようにすれば解析結果を複数ファイルに出力できる。 //Job configuration JobConf conf = new JobConf(); conf.setInputPath(inDir); FileOutputFormat.setOutputPath(conf, outDir); conf.setMapperClass(MOMap.class); conf.setReducerClass(MOReduce.class); ... //他の出力ファイルを