タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

amazonとhiveに関するmanabouのブックマーク (1)

  • ファイルを直接読み込んで集計する - クックパッド開発者ブログ

    こんにちは。マーケティングプロダクト開発部の中村です。今回は大量のデータを対象に集計できる Hive の使い方について説明しようと思います。 前提 私が所属しているマーケティングプロダクト開発部では広告配信も行っています。その広告配信では大量のアクセスログを蓄積しています。通常ですとそのログは Amazon Redshift で簡単に集計できます。しかし、ログファイルを直接集計しなければならない場合が稀にあります。その際に使用しているのが Amazon EMR です。今回は Hive を用いてその集計を手元の端末で試してみます。 インストール まずは動作環境を作るために Hive をインストールします。 brew install hive 集計する前の準備 Hive は任意のディレクトリを作業ディレクトリとすることができます。まず、その作業ディレクトリを作成し、そのディレクトリに移動してお

    ファイルを直接読み込んで集計する - クックパッド開発者ブログ
  • 1