ビッグデータ分析処理基盤として有効なHadoop×Mahoutの試用方法について記す。 方針: 基本的にWindows上でHadoopは動かないので、VMでLinuxを立てる。 多クラスタの分散モードは面倒なので、1台のPCで動く疑似分散モードを使う。 LinuxにHadoopを立てるのは面倒なので、Hadoopがインストール済みであるCDHパッケージを用いる。 手順: VMWare Playerのインストール CDHパッケージのダウンロード CDHパッケージのインストール CentOSの日本語化 コマンドベースでMahoutを実行 1.VMWare Playerのインストール 以下を参照。 http://www.atmarkit.co.jp/fwin2k/verification/vpcwin07/vpcwin07_01.html http://pc-os.seesaa.net/arti