バンデットアルゴリズムの一種 A Contextual-Bandit Approach to Personalized News Article Recommendation 解説に挑戦機械学習強化学習Recommendation 導入メリットと事例について ニュースレコメンデーションの問題 従来のニュースレコメンデーションのメインの手法である協調フィルタリングとコンテンツフィルタリングだと、以下の問題があります。 1:ユーザーの情報が必要 2:コンテンツの変更の反映が速いので追いつかない 3:学習と計算を早くしないといけない 4:新しいコンテンツはユーザー情報がないので協調フィルタリングが使用できない ユーザーの情報がない状態でコンテンツの変更が速くても対応したい バンデットアルゴリズムを用いましょう!! 対処方法 バンデットアルゴリズムとは ニュースレコメンデーションシステムの場合:よ