ひしだまHPの更新履歴。 主にTRPGリプレイの元ネタ集、プログラミング技術メモと自作ソフト、好きなゲームや音楽です。 2012/2/8のHadoopソースコードリーディング第8回に行ってきました! (→Togetter、他の人のメモ:johtaniさん、taro_xさん) 今回の最初は、@muddydixonさんの『オレオレMultipleInputを作る方法』(→資料)。 MongoDBからデータを読み込むMongoMultipleInputsを作ったという話。 「Mongoパス(URL)と読み込む条件とそれを処理するMapperクラス」を複数指定し、別々のMapTaskとして同時に処理できるということのようだ。 ただ、現状ではMongoDBのチャンク(分散場所の情報かな?)を見ているわけではないので、ネットワークの負荷はかかりそうな感じ。 キーと値にはBSONWritableが指定で