4. MLlib(機械学習) この章では「パーソナライズされた映画のリコメンド」という実例を通じて機械学習を学びます。 ここで使用するデータは、MovieLensによって取得された、ユーザが実際に映画を評価したデータ群で、以下のような規模のものです。 リコメンド総数:約1,000万件 ユーザ数:約72,000ユーザ 映画の種類:約10,000本 上記のデータは、training/data/movielens/largeに格納されています。 また高速に処理を行うためにデータ規模を小さくしたものがtraining/data/movielens/mediumに格納されています。 このデータは以下のような規模にそれぞれ縮小したデータセットです。 リコメンド総数:約100万件 ユーザ数:約6,000ユーザ 映画の種類:約4,000本 4-1. データセットの説明 training/data/movi