hiveとhadoopに関するt_horumonのブックマーク (2)

  • HiveServerを使用してPythonやPerlからHiveQLを実行する - たごもりすメモ

    HiveServerはThriftプロトコルをしゃべる*1ので、おなじくThriftで接続すると任意のクエリを発行できたりして大変便利。ということで、やったので、そのメモ。 準備 まずHiveServerだけど、hiveコマンドを叩いてクエリが実行できる状態なら以下のコマンドで起動する。*2 $ hive --service hiveserver ただしあらゆるデータ投入などをThrift経由でやるのは正直めんどくさい。hiveと叩けば起動するHive CLIでもデータ操作はしたい。なので conf/hive-default.xml にMetastoreの設定をする。今回は手元のMySQLに hive データベースを作り、それを使うようにした。このあたりが大変参考になった。 HiveのmetastoreをMySQLを使ってLocal Metastore形式で利用する - blog.kats

    HiveServerを使用してPythonやPerlからHiveQLを実行する - たごもりすメモ
    t_horumon
    t_horumon 2012/02/08
    hiveserverの使い方
  • Hadoop+Hive検証環境を構築してみる

    Hiveの基的な使い方 ここでは、Hiveの基的な使い方を説明します。はじめにテーブルの作成とデータの読み込みを説明し、次に検索と保存について説明します。 Hiveの起動と終了 ここでは、実際の説明に先立ってHiveの操作方法を示します。 Hiveはインタプリタ「hive」で操作します。起動方法は次のとおりです。

    Hadoop+Hive検証環境を構築してみる
    t_horumon
    t_horumon 2012/02/08
    サンプルテーブル
  • 1