タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

hiveに関するfubar_fooのブックマーク (4)

  • Hadoop Pig の使いどころ - Tech-Sketch

    「PigとHive何が違うの?」 「Difference between Pig and Hive? Why have both?(PigとHive何が違うの?)」 という質問を、先日、StackOverFlowで見かけました。恐らくHadoopを触ると一度は疑問に思う事ではではないでしょうか。 PigとHiveは、共にSQLライクな記法でMapReduceを書けるDSLですが、利用者数においてはHiveに軍配が上がっているようにみえます。 一方で、「Pigをもっと早く試せば良かった」というお話を伺うこともあり、有用(かもしれない)ツールであれば、正しく理解しておいた方がよさそうです。 というわけで、ここではPigの活用を探ります。 Pigの性能 Pigが今一つ利用されていないのは、SQLとの親和性に加え、性能面で、「JavaMapReduce>Hive>Pig」という傾向があるからで

  • Sorry, That Page Is Torn. - Brent Ozar Unlimited®

    “Can someone just give me a tl;dr?” Bad news: that page is gone. We try to keep our site as accurate and up-to-date as possible so that if you’re reading advice here, you can rely on it. That means from time to time, we decide that a page isn’t a great reference anymore, and the work to update it is beyond what we can do quickly in our free time. Head on over to the blog for newer stuff. Enjoy! Br

    Sorry, That Page Is Torn. - Brent Ozar Unlimited®
  • Hadoop用リアルタイムクエリエンジン Impalaのポテンシャルをレビューした

    Hadoop用リアルタイムクエリエンジン Impalaのポテンシャルをレビューした:Databaseテクノロジレポート(1/4 ページ) 2012年10月24日に発表されたばかりのHadoop用リアルタイムクエリエンジンをいち早くレビュー。次期CDHに組み込まれる予定の新機能をどう使いこなす? Impalaとは Impalaは、Googleが社内で利用しているDremelとF1にインスパイアされて開発されたオープンソースソフトウェアで、HDFS(Hadoop Distributed File System)あるいはApache HBaseに保存されているデータを対象に、アドホックなクエリを実行するためのツールです。Hadoopのディストリビューションベンダとして有名なClouderaが開発しています*1。 Hadoopファミリのソフトウェアは基的にJava言語で開発されていますが、Imp

    Hadoop用リアルタイムクエリエンジン Impalaのポテンシャルをレビューした
  • HiveQL TABLEメモ(Hishidama's Apache Hive TABLE Memo)

    HiveQL(HiveのSQLっぽい独自言語)のテーブルに関するメモ。 Hiveでは操作対象のファイル(基的にはHDFS上のファイル)をテーブルと呼んで扱う。 「テーブル」と呼んでいても、データの実体はファイル。 CREATE CREATE [EXTERNAL] TABLE [IF NOT EXISTS] テーブル名 [(項目名 型 [COMMENT コメント], …)] [COMMENT テーブルのコメント] [PARTITIONED BY (項目名 型 [COMMENT コメント], …)] [CLUSTERED BY (項目名, …) [STORED BY (項目名 [ASC|DESC], …)] INTO バケット数 BUCKETS] [ROW FORMAT 行フォーマット] [ STORED AS ファイルフォーマット] | STORED BY 'クラス名' [WITH SER

  • 1