概要 とりあえずMahoutをEclipse上で動かしてみる。 その後、Mavenでのインストールを実行し、Hadoop(擬似分散モード)と絡めて動かしてみる。 Hadoopのインストール手順については扱わない。 前提条件 前提条件として、Mavenが入っている必要がある。MavenはUbuntuならapt-get、RHEL系ならyumで入る。Cygwinの場合は公式サイトから落としてきてパスを通す。 Mahoutは最新の0.7のソースを使ってみる。 CDHで入れるという手もある。若干バージョンは古い(CDH3で0.5、CDH4で0.6)けど安定はしてるはず。 CDHの場合は、レポジトリの設定をCDH用のにする。 Eclipseのプロジェクトを作成する まずはEclipseでMahoutが動くプロジェクトを作成する。 Eclipseはm2e(MavenのEclipseプラグイン)がデフォル