タイトルそのままです. 機械学習領域において有名なデータはよくライセンスを確認してみるとそのままでは商用利用ができないことがしばしばあります. ブログや Qiita に書いたり,大学研究者であれば問題になりにくいとは思いますが,なんらかの企業に所属して研究開発やシステム開発を行っている場合には注意が必要になることがあるかもしれません*1. 色々あってライセンスについて少し調べたのと,ウェブ上での言及を見かけなかったのでここにメモを残します. MovieLens dataset MovieLens | GroupLens MovieLens dataset (以降 MovieLens) は GroupLens によって収集・公開されている映画の評価データです. このデータはそこそこの量があること,映画という馴染みの深い題材であることから,協調フィルタリングや行列分解を用いた推薦問題を解く際の