最近ビッグデータ()系のサーバに対してあれこれやってるんですが、ひょんなことから調べる必要が出てきたのでざっくりまとめてみました。 間違ってる所があれば、指摘をお願いします;-) 基本的な環境 CentOS 6.2(x86_64) PHP 5.5.11 CDH 4.6+Cloudera Impala 1.2.4(別途構築済み) CDHとは CDH(Cloudera's Distribution Including Apache Hadoop)は、Cloudera社から提供されているオープンソースなApache Hadoopディストリビューションの1つで、Apache HadoopやApache HBase、Apache Hive、Apache Pigなどのパッケージが含まれています。 とりあえず、CDHについては以下のページをざっと読むと良いかと。 CDH | Open Source |