今度はHiveも試してみました.http://www.cloudera.com/wp-content/uploads/2010/01/6-IntroToHive.pdfHome - Apache Hive - Apache Software Foundationメモ 解析前にテーブルを作る必要がある SQLのようにORDER BYやLIMITを使えるので,簡単な集計を1行で書ける Tokenizeが用意されていないのでWordCountとかするにはUDFが必要 クエリログ集計の例Pigに付属のexciteのクエリログで試してみる. CREATE TABLE querylog (freq INT, word STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t’ STORED AS TEXTFILE; LOAD DATA LOCAL IN