分散処理フレームワークHadoopの魅力 Hadoopとは、Apache ソフトウェア財団で開発されている、大規模データ処理のための分散処理フレームワークである。Google が自社の大量データを高速に処理するために開発した計算手法(MapReduce)と分散ファイルシステム(GFS)を、フリーソフトとして設計・開発したものである。 Hadoop の魅力は、大規模データ(ビッグデータ)を分散処理する環境が容易に構築できるところにある。従来型の処理環境では処理を細分化することが難しく、高性能なコンピュータを使っても長時間かけないと結果が出ないような問題を、MapReduce の処理に組み直すことにより簡単に処理の並列化が可能となる。クラウド環境の普及により、一時的に多数のコンピュータが簡単に利用できるようになったため、応用可能性が飛躍的に広がってきている。 たとえば、料理レシピサイトを運営す