さて今回から新しいテーマです。 分散計算フレームワークであるHadoopを導入から実践までを連載します。よろしくお願いします。 Googleの技術から生まれたHadoop わたしたちは日常、ごく当たり前にGoogleのサービスを使っています。 あそこの店の情報を知りたい、有名人xxさんってどんな人?、あの大事件を振り返って調べたい、などなど。生活に密着した情報だったり、過去を振り返って社会現象を調べたり、あるいは芸能人のゴシップネタを検索したりと、知りたいことは人それぞれで目的も全く違いますが、Googleの検索を利用すれば一発で目的の情報(あるいは近い情報)にたどり着くことができます。 世界中の何億というWebページについて文言によってインデックス化してなければとうていできない芸当です。そしてウェブページは新たに作られ、または消えてしまうものでもあります。ものすごく膨大なテキストデータの