多段のMapReduceを書く際に、_SUCCESS などのディレクトリは読み取られずには、次のFileInputFormatから無視されるけど、FileInputFormatは、どんな条件でフィルタをかけているんだろう?と思い確認してみました。 private static final PathFilter hiddenFileFilter = new PathFilter(){ public boolean accept(Path p){ String name = p.getName(); return !name.startsWith("_") && !name.startsWith("."); } }; "."および"_"から始まるPathは無視されるんですね。 FileOutputFormatを継承して自作のOutputFormatを作る場合、圧縮関連の処理はFileOutpu