Spark, SQL on Hadoop etc. Advent Calendar 2014 19日目です。 はじめに 前回Cloudera Manager APIを使ってCDHのインストールをするサンプルを紹介しました。 前回の内容をアレンジすることでインストール作業の自動化を図れるようになると思いますが、それでも処理には時間がかかると思います。その一因としてはデータのダウンロード処理が考えられます。これは検証などで繰り返し環境をセットアップする場合に特に問題になると思います。そこで、今回はローカルネットワークにリポジトリを作成してインストールを高速化する方法を紹介していきます。 リポジトリ作成後のインストール方法としては下記になります。 Cloudera Manager ServerをRPMでインストールする Cloudera Manager Agentをクラスタの各ノードでRPMでイ

