[B! develop][hive] pandazxのブックマーク

pandazx id:pandazx

developとhiveに関するpandazxのブックマーク (3)

DeveloperGuide
pandazx 2011/08/17
Hadoop

hive

develop
リンク
Hiveを動作させる場合の環境の切り替え方法 - wyukawa's diary
Hiveでテストする場合の話ですが、データ量が少ないならVirtualBox上のLinuxにCDHを擬似分散で入れてHiveを動かしてテストすればいいと思います。ただある程度のデータ量がないとテストにならないという場合もあるでしょう。本番環境で試行錯誤したいという状況もあると思います。そういった場合でもすでに動いている本番環境に影響を与えないようにしなければなりません。ここで言っている影響とは、例えば別の人がHiveで本番環境をばりばり使っている最中にうっかりデータを消してしまってLeaseExceptionとか発生させてしまうようなことです。なので使っているハードウェア、OS、ミドルウェアは同じでも他に影響を与えないようなサンドボックスを作ってそこでテストする必要があります。そこで僕のところでは今どうやっているかというと、例えばpage_viewというHiveのテーブルは本番
pandazx 2011/08/17
hive

hadoop

develop
リンク
細かすぎて伝わらないHiveのTips - wyukawa's diary
なんかドキュメントには書いてないっぽいんだけど地味に気づいたことを書いときます。 Tipsというほどではないメモですね。２つあります。１つめ HiveQLのコメントは--です。例： --hoge SELECT * FROM aaa ANTLRの文法を定義したファイルであるHive.gは下記のようになってますね。 COMMENT : '--' (~('\n'|'\r'))* { $channel=HIDDEN; } ;２つめ UDFの使用例を見たい時はextendedをつける例えば hive> desc function instr; OK instr(str, substr) - Returns the index of the first occurance of substr in strなら hive> desc function extended instr; OK inst
pandazx 2011/08/17
hive

develop
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx