はじめに、サブタイトル後半のSawzallはMapReduce用のDSLでこれが結構凄い上に、 GFSやMapReduceのようにオープンソースの代替物がないのだそうですが、 時間がないので詳しい話は聞けませんでした。 後日公開される講演資料に載ってるみたいです。 2007/12/31追記 2007/12/20に資料が公開されました。 丸山先生レクチャーシリーズ2007-2008第1回「Googleの分散処理技術」 こちらの下にある「サブセミナー第2回ハンズアウト」というPDFです。 MapReduceの位置付け 関数型プログラミングモデルに基づいて、大規模なデータセットの処理・生成を行うもの MapReduceというのはアルゴリズムの名前であり、 Googleで実際に稼動しているその実装の名前でもある。 MapReduce:数万台規模の分散処理が実際にちゃんと動いている (一方、grid