タグ

HadoopとMapReduceに関するconceal-rsのブックマーク (3)

  • Hive on AWS @ COOKPAD - クックパッド開発者ブログ

    こんにちわ。サービス開発担当の勝間です。クックパッドの1年の最大のピークであるバレンタインが終わり、少し落ち着きをとりもどした技術部からお届けします。 さて、先日秋葉原で「第0回 AWS User Group - Japan勉強会」が開催されました。100人を超す参加者の中、AWSのエバンジェリストJeff Barrさんの講演があったり、内容の濃いLTが続いたりと、非常に大盛況でした。そんなLTに僕も参加して、クックパッドのバッチシステムとAWSとの連携について話してきました。 クックパッドではAWSとしてEC2, S3をつかって分散解析環境を構築して、Hiveを使ったデイリーのログ解析を行っています。LTではそれらの話をしたのですが、5分と限られた時間では駆け足の発表になってしまったので、当日じっくり話せなかった箇所などを確認いただければと思います。 [slideshare id=328

    Hive on AWS @ COOKPAD - クックパッド開発者ブログ
  • クックパッドとHadoop - クックパッド開発者ブログ

    はじめまして。今年の5月に入社した勝間@さがすチームです。 入社してからは、なかなか大変なことも多いですが、最近はお酒好きが集まって月曜から飲み合う 「勝間会」なるものも発足して、仕事面でも仕事以外の面でも密度の高い毎日を過ごしています! さて、僕は「さがす」チーム所属ということで、普段はレシピを「さがす」ユーザの満足度を上げるために、 クックパッドの検索まわりについて、いろいろな開発を行っています。 一方で、ユーザの「さがす欲求」について深く知るために、大規模なデータ解析を行い、欲求の分析を行う機会も増えてきました。 ところが、クックパッドのログは膨大な数があるので、一口のデータ解析と言っても通常のバッチ処理だと間に合わないため、 分散処理環境の必要性が高まってきました。 そこで、まずは手軽に試せる分散処理の王道ということで、最近ではHadoopを使ったデータ解析環境を整備しています。

    クックパッドとHadoop - クックパッド開発者ブログ
  • Amazon EC2/S3,分散処理基盤Hadoopの設定支援機能「Elastic MapReduce」を提供

    Amazon.com傘下の米Amazon Web Services(AWS)は米国時間2009年4月2日,大量データの分散処理を支援するサービス「Amazon Elastic MapReduce」の米国向けベータ提供を開始したと発表した。AWSのクラウド・サービスと,オープンソースの分散処理プラットフォーム「Hadoop」を組み合わせ,大量データを扱う際に必要となる設定作業の負担を軽減する。 Amazon Elastic MapReduceを利用すると,ホスティング・サービス「Amazon Elastic Compute Cloud(Amazon EC2)」とオンライン・ストレージ・サービス「Amazon Simple Storage Service(Amazon S3)」で動かす分散アプリケーションに割り当てる演算リソースの量を簡単に指定できるという。Amazon EC2のインスタンス

    Amazon EC2/S3,分散処理基盤Hadoopの設定支援機能「Elastic MapReduce」を提供
  • 1