第12回 データマイニング+WEB @東京 ( #TokyoWebmining 12th)−機械学習MapReduce・大規模R解析 祭り− に参加してきました。 http://tokyowebmining12.eventbrite.com/ 以下、メモです。 1.「MapReduce〜入門編:仕組みの理解とアルゴリズムデザイン〜」 (講師:@doryokujin ) (発表30分+ 議論30分) Map Reduce 〜入門編:仕組みの理解とアルゴリズムデザイン〜 View more presentations from Takahiro Inoue ランダムアクセスを避け、シーケンシャルアクセス。シーケンシャルな読み取りに限定して高速化 MAP ReduceにSSDはあまり効果なし? SSDだと早くなるけど、如何せん高い Splitフェーズ 複数のmap処理を可能にするためデータを分割