とりあえずいまのところの理解をまとめておこうかと思います。 ご参考 http://www.infoq.com/presentations/apache-tez http://qconsf.com/system/files/presentation-slides/Apache-Tez-Accelerating-Hadoop-Query-Processing.pdf まず、先のリンク先の動画の冒頭のところで言及されているように、TezそのものはYARNにおける並列処理エンジンについてMapReduceの代替となること意識しているようです。その意味では、Tezを近年にみられるImpalaなどのリアルタイムクエリ系と同列にHiveのパフォーマンスを向上させるものだけであると見るのはあまり妥当ではなさそうです。 また、資料ではStreamingを将来においてサポートすると言っていて、Tezだけででラ