何をするかと言うと。。。 ASCII.technologies 2011年1月号で、リッテルの清田さんが、バスケット解析処理を Hive で記述した例を掲載しています。同じ事を Jaql でやって、Hive との違いを味わってみます。 前準備 使用するデータは、Pig に付属の Web 検索ログのサンプルです。タブ区切りで、「ユーザID, タイムスタンプ(YYMMDDhhmmss), 検索文字列」が並びます。 $ wget http://www.apache.org/dist/hadoop/pig/pig-0.7.0/pig-0.7.0.tar.gz $ tar -xvzf pig-0.7.0.tar.gz $ cd pig-0.7.0/tutorial/data $ bunzip excite.log.bz2 $ head excite.log 9593C58F7C1C5CE4 9709