タグ

2013年10月25日のブックマーク (1件)

  • Impalaセットアップ – OpenGroove

    数ヶ月前にImpalaで遊んでみようとしたときは、Cloudera Managerから入れるのは簡単だけど個別に入れるのは面倒くさそうだったのでスルーしてしまったが、先日購入したO’REILLY の「プログラミングHive」にセットアップ方法が記載されていたのでやってみた。でも書籍の方はレポジトリURLの情報が古かったり、しましたね。設定ファイルの内容も若干変わっている様子。 環境はAWSのLargeインスタンス、CDH4.3のHadoop疑似分散モード。いつもはSmallマシンをケチケチいじっているのだが、Impalaはリソースをかなり喰うと聞いているので、Smallじゃ無理だろう、と。もともと使っているHadoop疑似分散モードのマシンからAMIを取得して、Largeで起動。HBase, Hiveのセットアップも済んでいるから、楽チン(ImpalaはHiveと共通のメタストアを使用する