タグ

ブックマーク / technohippy.hatenadiary.org (1)

  • MapReduce - ずっと君のターン

    マルレクサブセミナーのメモ。 MapReduceの入出力単位はKey:Valueの組(ペア)のリスト 処理単位はMapとReduceに加えて、隠された処理であるSort 大まかな処理の流れは Map : 処理に適したペアに組みなおす(入出力は一対一) Sort : 出力をReduceの入力として渡した際に処理を分散できるような形(同じキーごと)に並び替え Reduce : 同じキーの組をまとめて処理して結果として一対のペアを生成(入出力は多対一) MapとReduceはいくらでも分散可能 Sortが一番重い MapにはCombineと言う処理も含まれる? ReduceにSortが含まれる? Shuffle = Sort + Partitioning?(三つの使い分けはよく分かりませんでした) まだいろいろあったけど、とりあえずこの辺まででなんとなく感じたアルゴリズムをものっそ適当に、分散す

    MapReduce - ずっと君のターン
  • 1