タグ

2009年11月4日のブックマーク (2件)

  • はてな がHadoopを使っているという話。

    hadoop on Flickr - Photo Sharing! タイトルまんまです。 はてなは現在Hadoop(分散処理のMapReduceのため)をログ解析・検索インデックスの構築・Webのクローリングに使っているそうです。 はてなキーワードの全文検索部分に利用されているとのこと。これはインターンで学生が実質2週間で実装しました…とのこと!? Hadoop Streaming - naoyaのはてなダイアリー はてながこういったエントリーを書いているのは、実験して遊んでるからじゃなくて実際に活用しているからなんですね:-) 一番最初にHadoopを導入した理由はログ解析の効率化のためのようです。 でも、基盤に近いからかインターネット上に情報が少ないのが残念です。 自分も還元していきたいけど、チュートリアル程度の事しか出来ないから…涙目 via 日経ソフトウェア 2009/1月 (Ha

    はてな がHadoopを使っているという話。
    satfy
    satfy 2009/11/04
  • クックパッドとHadoop - クックパッド開発者ブログ

    はじめまして。今年の5月に入社した勝間@さがすチームです。 入社してからは、なかなか大変なことも多いですが、最近はお酒好きが集まって月曜から飲み合う 「勝間会」なるものも発足して、仕事面でも仕事以外の面でも密度の高い毎日を過ごしています! さて、僕は「さがす」チーム所属ということで、普段はレシピを「さがす」ユーザの満足度を上げるために、 クックパッドの検索まわりについて、いろいろな開発を行っています。 一方で、ユーザの「さがす欲求」について深く知るために、大規模なデータ解析を行い、欲求の分析を行う機会も増えてきました。 ところが、クックパッドのログは膨大な数があるので、一口のデータ解析と言っても通常のバッチ処理だと間に合わないため、 分散処理環境の必要性が高まってきました。 そこで、まずは手軽に試せる分散処理の王道ということで、最近ではHadoopを使ったデータ解析環境を整備しています。

    クックパッドとHadoop - クックパッド開発者ブログ
    satfy
    satfy 2009/11/04