Hadoop Streaming 2008 年 9 月 30 日 1 Hadoop Streaming Hadoop Streaming は Hadoop ディストリビューションに付属するユーティリィティで、mapper あるいは reducer として任意の実行ファイルやスクリプトによる Map/Reduce ジョブの作成と実行を可能にします。 例えば: $HADOOP HOME/ bin /hadoop j a r $HADOOP HOME/hadoop−streaming . j a r \ −input myInputDirs \ −output myOutputDir \ −mapper / bin /cat \ −reducer / bin /wc 2 Streaming の動作 前述の例では、mapper と reducer はいずれも入力を(行単位で)stdin からリー