モバイル広告という、難度の高いサービスを展開する会社が、データ活用プラットフォームをRDBMSからHadoopに置き替えるまでの実録とハウツーを紹介します。 本連載の第1回目ではCyberZの広告効果計測ツールF.O.Xの概要とClouderaManager(以後、CM)の導入経緯についてお話しました。第2回目となる今回はいよいよCM自身の導入手順とCMを使ったHadoopクラスター構築について解説します。 ハードウェアの事前設計は、電力・拡張性がキモになった まず、今回使うHadoopエコシステムやクラスター・ハードウェア構成の説明をなるべくオープン紹介しておきましょう。 前回解説したようにHadoopディストリビューションはClouderaのCDH(Cloudera Distributed Hadoop)を利用します。CDHのバージョンは4.4.0、CMのバージョンは4.7.3、サーバ
![わが社はいかにしてHadoopクラスター環境を構築したか](https://cdn-ak-scissors.b.st-hatena.com/image/square/1f720a82e8b813b13d8d188fd88dc8c3aae62a28/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fait%2Farticles%2F1403%2F25%2Fmhdb_cy02_fig01.jpg)