タグ

hadoopに関するkatsu-iのブックマーク (3)

  • 第9回 進化するレコメンドシステム | gihyo.jp

    この連載も今回で最終回。最後にまとめとレコメンドシステム作成の周辺の話題を取り上げます。 レコメンドのアルゴリズムとその目的 今回紹介したレコメンドのアルゴリズムは、協調フィルタリング、およびコンテンツベースフィルタリングに属するものでした。それぞれに対してユーザベースおよびアイテムベースのアルゴリズムが存在します。 さらにそれぞれに対し、類似度に既存の関数を利用、あるいは新規に関数を定義したり、重み付けの種類等で数多くの派生形が存在します。 数あるレコメンドのアルゴリズムの選択基準は、導入するサービスの目的やビジネスモデル、ユーザのタイプ、及び現時点で利用可能なデータの量および質に依存します。たとえば、検索サービスやECサイトでは、各ユーザの検索を効率化=サービスの利用時間を短くするレコメンドが、コミュニティサイトやポータルサイトでは、各ユーザの滞留時間=サービスの利用時間を長くするレコ

    第9回 進化するレコメンドシステム | gihyo.jp
  • HadoopをWindows上の仮想マシンで手軽に試す方法

    Hadoopといえば大規模分散フレームワークであり、実行にはそれなりのサーバ群を揃えなければならない、と思われがち。 しかしHadoopでもっとも有名なディストリビューションを提供するClouderaは、PC上の仮想マシンで手軽にHadoopを実行できる仮想マシンイメージ「Cloudera's Hadoop Demo VM for CDH4」を無償公開しています。 VMware Player、KVM、VirtualBoxなど幅広い仮想マシンに対応。個人のPCを使って、例えばWindowsの上でも簡単にHadoopを試すことができます。 仮想マシンを使ったHadoopの実行手順を詳しく解説

    HadoopをWindows上の仮想マシンで手軽に試す方法
  • NTTデータのHadoop報告書がすごかった - 科学と非科学の迷宮

    業界トップ のエンタープライズ Hadoop 企業 Cloudera に入社しました http://www.cloudera.co.jp/ 今年の6月に、「平成21年度 産学連携ソフトウェア工学実践事業報告書」というドキュメント群が経産省から公表されました。 そのうちの一つに、NTTデータに委託されたHadoopに関する実証実験の報告書がありましたので、今更ながら読んでみることにしました。 Hadoop界隈の人はもうみんなとっくに読んでるのかもしれませんけど。 http://www.meti.go.jp/policy/mono_info_service/joho/downloadfiles/2010software_research/clou_dist_software.pdf 「高信頼クラウド実現用ソフトウェア開発(分散制御処理技術等に係るデータセンター高信頼化に向けた実証事業)」という

    NTTデータのHadoop報告書がすごかった - 科学と非科学の迷宮
  • 1