前の2エントリで書いたTPC-HをImpalaで動かすためのスクリプトをGithubに上げました. https://github.com/kj-ki/tpc-h-impalaになります. 実行手順 以下の例では,ClouderaのImpala Demo VMが起動していることが前提です. あとは↓に書いてあるとおりにやれば動くはず. まず,Gitを入れます.(ここだけはrootで) yum install git -y Impala用スクリプトをダウンロード. git clone https://github.com/kj-ki/tpc-h-impala TPC-Hデータを生成. wget http://www.tpc.org/tpch/spec/tpch_2_14_3.zip mkdir tpch cd tpch unzip ../tpch_2_14_3.zip cd dbgen cp