Spark, SQL on Hadoop etc. Advent Calendar 2014 11日目です。 はじめに Hadoop クラスタの構築は手のかかる作業ですが、Cloudera Managerのようなツールを使えばかなりインストール作業は簡単になります。また、設定なども適宜デフォルトから推奨値に変えてくれたりするので便利です。 ただし、Cloudera ManagerのGUIを使うとインストールは非常に簡単になるのですが、それでも検証などのために環境の作成/削除を繰り返すといった場合、逆にGUI操作が自動化のネックになります。 Cloudera Managerはこの点も考慮していてAPIを公開してCUI処理で代替できるようになっています。 今回はこのCloudera Manager APIを使ったクラスタ構築の簡単なサンプルを紹介します。 前提 CentOS6.5がインストール