タグ

HiveとPigに関するwyukawaのブックマーク (2)

  • Hive & Pig

    Hive & Pig Two ways of doing one thing Or One way of doing two things Ashutosh Chauhan Who am I? • Pig Committer & PMC Member • Hive Committer & PMC Member • Hcatalog Committer & PPMC Member • ASF Member • Software Engineer at HortonWorks Two ways of doing same thing • Both generate map-reduce jobs from a query written in higher level language. • Both frees users from knowing all the little secret

    wyukawa
    wyukawa 2012/09/18
    PDF注意。PigとHiveの比較スライド。バックエンドはPigでフロントエンドがHiveかな。
  • Hadoop Pig の使いどころ - Tech-Sketch

    「PigとHive何が違うの?」 「Difference between Pig and Hive? Why have both?(PigとHive何が違うの?)」 という質問を、先日、StackOverFlowで見かけました。恐らくHadoopを触ると一度は疑問に思う事ではではないでしょうか。 PigとHiveは、共にSQLライクな記法でMapReduceを書けるDSLですが、利用者数においてはHiveに軍配が上がっているようにみえます。 一方で、「Pigをもっと早く試せば良かった」というお話を伺うこともあり、有用(かもしれない)ツールであれば、正しく理解しておいた方がよさそうです。 というわけで、ここではPigの活用を探ります。 Pigの性能 Pigが今一つ利用されていないのは、SQLとの親和性に加え、性能面で、「JavaMapReduce>Hive>Pig」という傾向があるからで

    wyukawa
    wyukawa 2012/08/28
    へー、PigってHiveより遅いんだ。ただメタデータが要らないので導入しやすいよな。
  • 1