Pigによるデータ処理 これからいよいよ、Pigを用いたデータ処理を“体感”していきます。Amazonのデータアーカイブを公開しているサイト(http://liu.cs.uic.edu/download/data/)には、いくつかのファイルがあります。今回は「reviewsNew.rar」(約1.7Gバイト)を任意のディレクトリにダウンロードし、解凍しましょう。 このファイルを含め、すべてのファイルのデータは英文です。データの各項目はタブ区切りになっています。各項目の詳細はこのディレクトリにある「README.txt」に書かれていて、後ほどこのファイルを参考にスキーマを定義します。 「解凍したデータファイルをHDFSにコピーし、Pigを起動し、データをロードする」という手順で進めていきます。まず図1のようにコマンドを実行します。カレントディレクトリに解凍したreviewsNew.txtが、