さて、前回のログでは、Mahout 0.7に付属する「factorize-movielens-1M.sh」というサンプルをつかって、Pararell ALSというアルゴリズムを動かしてみた。 少し誉めすぎた感が否めないので、原論文「Large-scale Parallel Collaborative Filtering for the Netflix Prize」を解説しつつ、Mahoutでの実装を追いかけてみたい。 内容的には、理工系学部の専門過程の人あたりをターゲットに書いていく(自分は一サラリーマンであって、大学の先生ではないのだが、前提を書いておくのは重要だと思う)。 先のログにも書いたが、Parallel ALS(Parallel Alternating Leaset Squares)は、疎な行列(Sparse Matrix)を前提とした、次元縮約(dimension reduc