エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Goでバンディットアルゴリズムを実装する - Carpe Diem
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Goでバンディットアルゴリズムを実装する - Carpe Diem
概要 複数の案を試す際にA/Bテストがありますが、検証期間中はずっと同じ割合で試行しなければいけない... 概要 複数の案を試す際にA/Bテストがありますが、検証期間中はずっと同じ割合で試行しなければいけないため、もし悪い案であった場合に全体としてその期間損失を生むことになります。 そのような損失を少なくしつつ、良いと思われる案を優先的に試行するアルゴリズムとしてバンディットがあります。 ref: https://vwo.com/blog/multi-armed-bandit-algorithm/ 環境 Go 1.20.1 gonum/stat/distuv v0.12.0 前提知識 バンディットでは UCB1 Softmax ε-greedy Thompson Sampling などがありますが、今回はThompson Samplingを対象とします。 またThompson Samplingではベータ分布の知識が必要なので簡単に説明します。 ベータ分布 ベータ分布は連続確率分布の1つで、成功数