メタストアの役割 まず、Hadoopはデータベースではありません。HiveはHadoop(Hadoop分散ファイルシステム)にあるデータを処理するために、HiveQLにより開始されるMapReduceジョブをHadoopクラスタに投入(サブミット)するだけです。Hadoopクラスタからみれば、ワードカウントや円周率を計算するようなMapReduceジョブを実行することと、何の違いもありません。 このとき、MapReduceとして処理するために用いられるのがメタストアです。 昨日実行したクエリを例にしてみましょう。 SELECT * FROM sample_07 ORDER BY salary DESC; テーブルの名前は sample_07。ORDER BY salary としているので、少なくとも salary という列がありそうだことがわかります。 先ほど書いたように、Hiveで処理す
![2014年版 Hadoopを10分で試す(4) まずはHiveから(中編)](https://cdn-ak-scissors.b.st-hatena.com/image/square/f05e6366da02da0a5401eb2def43c7d700433518/height=288;version=1;width=512/https%3A%2F%2Flinux.wwing.net%2FWordPress%2Fwp-content%2Fthemes%2Fcocoon-master%2Fscreenshot.jpg)