タグ

Hadoopとsqlに関するyassan0627のブックマーク (2)

  • Impala 4.0 とPresto 350によるSQLレシピ本の検証(1)

    Distributed computing (Apache Spark, Hadoop, Kafka, …) Advent Calendar 2021 23日目です。 今年も Hue について書こうかと考えていましたが、最近 SQL(Presto)やEmbulk,Digdagを使う機会が増えているので趣向を変えてみます。 Hueについて興味がある方は[公式ブログ(日語)](http://https://jp.gethue.com//posts/ “公式ブログ(日語)”)をご覧ください。翻訳サボってます・・・ ———— SQLレシピとは? ビッグデータ系の良書の一冊でもある「ビッグデータ 分析のためのSQLレシピ」、出版から4年経過しても色あせることはありません。 この書籍では、SQLの記述方法から分析手法まで広く扱われおり、写経するだけでも大きな知見が得られるでしょう。一方、扱われ

    Impala 4.0 とPresto 350によるSQLレシピ本の検証(1)
  • HAWQ を CDH で動かす - Qiita

    HAWQとは HAWQはPivotalが開発したHadoop上で動作するSQL実行エンジンです。 現在はApacheに寄贈され、Apache HAWQとして公開されています。 HAWQに近い位置付けのものには、Clouderaが主導するImpalaがあります。 HAWQの中身はPostgreSQLをベースに分散環境に対応したGreenplumをHadoopに対応したものと考えればよいと思います。 PostgreSQLをベースにしていることから、数あるSQL on Hadoopの中でもSQLへの準拠レベルが高いことが特徴になっています。 詳細はEnterprise SQL on Hadoop with Pivotal HDBが参考になります。 PivotalとODPi ODPiはHadoopの相互運用性を目的としてHortonworks、Pivotalを中心に設立された団体です。 Hadoo

    HAWQ を CDH で動かす - Qiita
    yassan0627
    yassan0627 2017/03/30
    HAWQ=ホークと呼ぶ。SQLへの準拠レベルが高い。Impalaみたいなもの。
  • 1