タグ

Hiveに関するkuppi0216のブックマーク (4)

  • Turbocharge your Apache Hive Queries on Amazon EMR using LLAP | Amazon Web Services

    AWS Big Data Blog Turbocharge your Apache Hive Queries on Amazon EMR using LLAP NOTE: Starting from emr-6.0.0 release, Hive LLAP is officially supported as a YARN service. So setting up LLAP using the instructions from this blog post (using a bootstrap action script) is not needed for releases emr-6.0.0 and onward. ——————————- Apache Hive is one of the most popular tools for analyzing large datase

    Turbocharge your Apache Hive Queries on Amazon EMR using LLAP | Amazon Web Services
  • Hiveのユーザー定義関数(UDF)を作成する - Qiita

    Qiita:Teamへの移行のため、この記事は https://blog.sioyaki.com/entry/2016/06/02/073548 に移行されました。この記事は移行のために一定の期間を置いて削除します。

    Hiveのユーザー定義関数(UDF)を作成する - Qiita
  • Hive on Spark を活用した高速データ分析 - Hadoop / Spark Conference Japan 2016

    現在、DMM.comでは、1日あたり1億レコード以上の行動ログを中心に、各サービスのコンテンツ情報や、地域情報のようなオープンデータを収集し、データドリブンマーケティングやマーケティングオートメーションに活用しています。しかし、データの規模が増大し、その用途が多様化するにともなって、データ処理のレイテンシが課題となってきました。発表では、既存のデータ処理に用いられていたHiveの処理をHive on Sparkに置き換えることで、1日あたりのバッチ処理の時間を3分の1まで削減することができた事例を紹介し、Hive on Sparkの導入方法やメリットを具体的に解説します。 Hadoop / Spark Conference Japan 2016 http://www.eventbrite.com/e/hadoop-spark-conference-japan-2016-tickets-2

    Hive on Spark を活用した高速データ分析 - Hadoop / Spark Conference Japan 2016
  • Hiveのメタストアについておさらい – OpenGroove

    Hiveのメタストアは、何かにつけて、ハマる。分かっているつもりで分かってなかったことも、未だにある。このブログ内や他の場所のあちこちに気づいたことを書いているが、散乱しているのでここでまとめてみる。 以下、過去記事からの引用。 メタストアサービスについて Hiveではメタストアサービスと呼ばれるものを利用する。メタストアサービスはテーブル定義、ここでは「テーブルとHDFS上のデータの対応情報」を管理する。メタストア自体はRDBMSを使用してその情報を管理している。メタストアサービスは以下の3種類があり、要件によって使い分ける。 組み込みメタストア もっとも手軽に利用できる形態。HiveにはJavaで実装されたDerbyというDBが組み込まれており、そのDBをメタストアリポジトリとして利用する。hiveコマンド起動によりDerbyも起動する。同時に一人のユーザーしかHiveを利用できない、

  • 1