タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

hadoopに関するfjtknjのブックマーク (3)

  • Amazon EMRでMahoutのレコメンデーションのワクワク感を体験する:30分でできる分散レコメンデーション - tetsuya_odakaの日記

    追記:2013/9/17 このログの続編の投稿が完了しましたので、記事の末にリンクを追加しました。これで、このログの方法を応用した分散レコメンデーションエンジンの構築もばっちり(のはず)です。 先のログでは、Parallel ALS(Alternating Least Squares)を用いたレコメンデーションの理論面のフォローアップと、Apache Mahoutでの実装を少し詳しくみた。 このアルゴリズムは極めてシンプルで、かつ、Apache MahoutではHadoop上でスケーラブルに実装されている。 Apache Mahoutは発展途上のプロジェクトなので、スケーラブルに実装されているアルゴリズムとそうでないアルゴリズムがあって、レコメンデーションについていえば、0.8では、アイテムベースのレコメンデーション、Slope Oneレコメンデーション、Parallel ALSを使ったレ

    Amazon EMRでMahoutのレコメンデーションのワクワク感を体験する:30分でできる分散レコメンデーション - tetsuya_odakaの日記
    fjtknj
    fjtknj 2014/09/01
    これで試す!
  • Chefを使ってCDHをインストールしてみた | Little by little, and bit by bit

    最近世間でビッグデータと言う単語をちらほら聞くようになった(もう最近ではないかもだど。。。)せっかくなので波にのってちょっとビッグデータとやらに触れてみようと思う。 まずは、ビッグデータ分析によく使われるhadoopをインストールしてみようと思う。 hadoopにはいろいろディストリビューションがあるらしいが、今回はCDH(Cloudera’s Distribution including Apache Hadoop)を使用する。また、簡単に再構築できるようにインストールにはChefを利用する。 インストールにあたって次のページを参考にした。 http://www.cloudera.com/content/cloudera-content/cloudera-docs/CDH4/4.2.0/CDH4-Installation-Guide/cdh4ig_topic_4_4.html [前準備]

    Chefを使ってCDHをインストールしてみた | Little by little, and bit by bit
  • 試すのが難しい―機械学習の常識はMahoutで変わる

    ビッグデータ時代―なぜ、いま機械学習なのか Apache Hadoop(以下、Hadoop)の登場で、今まで捨てていたデータ、貯めるだけで処理しきれなかったデータを活用できるようになりました。 活用手段として最近とみに注目されている技術が「機械学習」であり、Hadoopの強みを生かし簡単に機械学習を行うためのライブラリが、「Apache Mahout」(以下、Mahout)です。 稿ではMahoutを動かしてみることで、機械学習の常識を身に付けます。 そもそも、機械学習とは? 機械学習とは、一定のデータをコンピュータ・プログラムに「学習」させ(すなわち、そのデータに潜むパターンや規則性を表す「モデル」を自動的に構築させ)、他のデータにそのモデルを適用すれば、あたかも人間のように複雑で柔軟な判断が行えるようにするという試みです。 機械学習をビジネスに活用した例は、レコメンド(ユーザーや商品

    試すのが難しい―機械学習の常識はMahoutで変わる
  • 1