情報を扱う会社にとってデータセンターが頭脳だとしたら、グーグルの頭脳はずばぬけていると言えます。グーグルはどんどん進化していますが、基本的には、全てを「知りつくす」ビジネスで、その扱うデータは膨大です。 グーグルがいかにその頭脳を磨いているのか、続きで解説します! 膨大なデータを処理するためのグーグルの主要武器はMapReduceという自社開発システムです。通常のフレームワークでは、きちんとタグ付けされ、整理されたデータベースが必要になるのに対し、MapReduceはプロセスをシンプルにすることで、どんなデータでも処理でき、たくさんのマシンに分配することができています。 MapReduceには、その名のとおりふたつのステップがあります。MapステップとReduceステップです。2008年時点、WiredではGoogle Books内での単語出現頻度の判定タスクを想定した解説をしています。