[B! *あとで読む][*hadoop] mopinのブックマーク

mopin id:mopin

あとで読むとhadoopに関するmopinのブックマーク (1)

第7回　コンテンツベースのレコメンドシステムのHadoop実装［中編］ | gihyo.jp
処理の流れと各処理におけるデータ形式前回の繰り返しになりますが、Hadoopで同じ関数を使い類似性の計算をするのであれば、コンテンツベースと協調フィルタリングの違いは、keyおよびvalueの設定の違いにあります。今回利用するデータも協調フィルタリングと同様にAmazon review data setです。このデータは以前紹介した場所から、現在は次の場所に移っています。 URL：http://liu.cs.uic.edu/download/data/ アイテム間の相関を協調フィルタリングではユーザの数で計算しましたが、コンテンツベースでは単語の数で計算します。したがって、MapReduceの第一段階における＜key value＞は協調フィルタリングでは＜ユーザid アイテムid＞でしたが、コンテンツベースでは＜単語id アイテムid＞となります。図1にMapReduceの各段階で使
mopin 2012/06/06
Hadoop

hadoop

**1206

*あとで読む

*連載

*hadoop
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx