前回 id:fits:20101010、Scala で実装した MapReduce のコードを完全分散モードで実行してみました。 今回は、クラスタ上の全デーモンを起動する start-dfs.sh スクリプトは使わずに、hdfs や mapred を使って NameNode・DataNode、JobTracker・TaskTracker を手動で起動しています。 多少不便ですが、こうする事で一般的に紹介されているような SSH の設定等は不要となります。 また、完全分散モードで実行する場合、Job オブジェクトに setJarByClass() しておきます。(スタンドアロン実行だけなら不要) ちなみに、setJarByClass を行っていないとリモート側に JAR ファイルを手動で配置する羽目になります。 ・・・ object MoneyCounter { def main(args: