MongoDBのMapReduceでTF-IDFによる日本語の全文検索を実装する(Part 1) https://github.com/exabugs/similarity_search 前提 MongoDB は v2.4.8 以上のこと。 (mac の brew でインストールされる 2.4.6 だと MapReduce が不安定です。) 形態素解析は行いません。事前にMeCab等で形態素解析して単語(名詞)を抜き出して下さい。 仕様 以下のようなtweetsコレクションを対象とします。 (対象となるコレクション名は 'master_name' という変数に入れてください。) > db.tweets.find(); { "_id" : ObjectId("52afd7b550433450593e0100"), "content" : "到着後はお早めに召し上がり下さい", "tf" :