Amazon Elastic MapReduceで日本語のwordcountを試したので、備忘録的な意味も込めてその時のメモをまとめます。pythonで書いてますが、形態素解析のライブラリがあればどの言語でも大丈夫だと思います。 目次 Amazon Elastic MapReduce Ruby Clientインストール hadoopの設定 形態素解析エンジンIgo用の辞書構築 bootstrap.sh作成 mapper.py作成 reducer.py作成 入力ファイル作成 jobflow作成 step追加 処理結果確認 jobflow停止 Amazon Elastic MapReduce Ruby Clientインストール http://aws.amazon.com/developertools/2264 からダウンロードしてきます。 $ wget http://elasticmapred