こんにちは、 Wantedly Visit の recommendation squad で Data Engineer をしている大坪です。今は Data Scientist が作ったモデルのうち「どれをどのくらいの比率で活用するべきか」を自動で解決するために多腕バンディット問題に取り組んでいます。今回はここでハマったことについて書きます。 多腕バンディットとは?ざっくりいうと「真の期待値が不明である複数のアイテムからどれを活用するべきか」という問題についた名前です。より正確な真の期待値を知るために期待値の低いかもしれないアイテムを使ってみる探索(explore) と、真の期待値が高そうだと思われるものを積極的に使ってみる活用 (exploit) をどのような割合/方策で行うかが重要なポイントです。 動画サービスならどの動画をおすすめするか、Wantedly ならどのシゴトの募集を提示