このエントリはSpark, SQL on Hadoop etc. Advent Calendar 2014 - Qiitaの13日目の記事です。 Apache Drillとは SQL分散クエリエンジンです。 標準SQLサポートや様々なデータソースへの接続などの特徴があります。 今回は特徴の一つである”スキーマレスデータに対するSQLクエリ”を実行してみます。 Drillについて詳しくは こちらを参照ください。 環境準備 MapRのSandBox版を使います。 インストール方法は下記を参考にして下さい。 Drillは下記バージョンがインストールされてました。 mapr-drill.noarch 0.5.0.275270-1 @/mapr-drill-0.5.0.275270-1.noarch JSON形式のサンプルデータは下記を使用します。 Aggregation with the Zip