(本ブログは若干古くなっているので、Impala情報ページをご覧下さい。比較的新しい情報をまとめています) 一人アドベントカレンダー25日目、最終日です。 最終日はCloudera Impala(以下Impala)について。Impalaは分散クエリエンジンです。最近EMRでも利用できるようになりました。 Hiveとは何が違うのか、なぜHiveを高速化しなかったのかというような意見もあるようですが、その答えはClouderaの創業者でもあるMike Olsonが今週公開したブログ(Impala v Hive)に詳しく書かれています。かなり興味深い内容ですが、今のところ英語のみです。きっと日本語の記事もいずれ読めるようになるはず。。。 さて、最終日はCloudera Impalaのアーキテクチャについて書いてみます。引用している資料はSlideshareでClouderaが公開しているものです
![Cloudera Impalaのアーキテクチャ](https://cdn-ak-scissors.b.st-hatena.com/image/square/f05e6366da02da0a5401eb2def43c7d700433518/height=288;version=1;width=512/https%3A%2F%2Flinux.wwing.net%2FWordPress%2Fwp-content%2Fthemes%2Fcocoon-master%2Fscreenshot.jpg)