サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
デスク環境を整える
speakerdeck.com/usaito
@『反実仮想機械学習』出版記念イベント#1 https://cfml.connpass.com/event/313112/ Amazon: https://www.amazon.co.jp/dp/4297140292 質疑応答: https://docs.google.com/document/d/1P9C6ajiJZVGL0u77TbHvspJs_vfLE_b9puTxlSrVVuM/edit?usp=sharing 概要: 反実仮想(Counterfactual)─ 起こり得たけれども実際には起こらなかった状況 ─ に関する正確な情報を得ることは、機械学習や意思決定最適化の応用において必要不可欠です。例えば、「現在運用している推薦アルゴリズムを仮に別のアルゴリズムに変えたとしたら、ユーザの行動はどのように変化するだろうか?」や「仮に個々の生徒ごとに個別化されたカリキュラムを採用したら、
推薦やランキングの研究では、長らくユーザー満足の最大化を至上命題として多くの手法が提案されてきました。しかし最近では、ユーザー満足のみならずアイテム間の公平性を担保することも等しく重要である応用がむしろ多くなっています。例えばマッチングアプリにおけるユーザー推薦においては、イケメンを優先して女性側に推薦することで(ユーザー満足を図る指標としてよく用いられる)クリックを多く稼ぐことができるでしょう。しかしそれでは一部のイケメンばかりにマッチが集中してしまい、発表者のような非イケメンは結局いつまで経ってもマッチできないことになります。そんなことでは、優先して推薦されるイケメン達への妬みがこれまで以上に増幅し、推薦されやすさの意味で不公平を被る多くのユーザーがプラットフォームを去ってしまいかねません。同様の不公平な状況はYouTube, Amazon, Spotify, Airbnb, Link
勉強会リンク:https://cfml.connpass.com/event/179600/ 論文リンク:https://arxiv.org/abs/1909.05299 論文概要: 機械学習的な汎化誤差最小化の定式化に基づく因果効果予測手法が乱立傾向にあります。またそれらの手法は、多くのハイパーパラメータを有しています。そうした背景から、各環境について最適な予測手法とハイパーパラメータを選択するという手順の重要性が増している一方で、その手順に関する研究はあまり進んでいません。本研究では、観測可能なデータのみを用いてデータドリブンに、因果効果予測手法のモデル選択やハイパーパラメータチューニングを行うための方法を提案します。また、ベンチマークデータセットを用いて、既存のヒューリスティックな評価指標よりも提案手法がより良い性能を持つモデルを候補集合の中から探し当てられることを実証します。
@ソニーR&Dの皆様
https://machine-learning-pitch.connpass.com/event/137427/
方策の長期性能に対する�効率的なオフライン評価・学習 (Long-term Off-Policy Evaluation and Learning)
このページを最初にブックマークしてみませんか?
『speakerdeck.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く