エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント3件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
第10回 同じ処理でも実行時間の異なるHiveQLの書き方 | gihyo.jp
今回は、halookでHiveがどのように実行されるかを見ていきます。なお、前回の連載までと異なり、今回は... 今回は、halookでHiveがどのように実行されるかを見ていきます。なお、前回の連載までと異なり、今回は、halookをCDH3ではなくCDH4に適用した結果を記載しています。 Hiveとは? Hiveは、HDFS上のデータをHiveQLと呼ばれるSQLライクなクエリ言語で処理できるようにしたもので、CDHにも含まれています。HiveQLで記述した命令が、自動でMapReduceに変換されるため、ユーザ自身がMapReduceジョブプログラムを記述する必要がなく、データ解析が簡便に行えます。 Hiveを使うためには、まずデータを、Hiveテーブルとして保存する必要があります。カンマ区切りや、タブ区切りで保存されたデータに対して、カラム名や型などのテーブル定義を示すことによって、Hiveテーブルを作成できます。HiveQLの構文はSQLと若干異なるところがあるものの、多くのSQL構文をサポ
2014/10/09 リンク