エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
多腕バンディット問題を解説してPythonで実験してみた
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
多腕バンディット問題を解説してPythonで実験してみた
こんにちは、ぐぐりら(<a href="https://twitter.com/guglilac">@guglilac</a>)です。 ## 多腕バンディ... こんにちは、ぐぐりら(<a href="https://twitter.com/guglilac">@guglilac</a>)です。 ## 多腕バンディット問題とは スロットマシーンで遊ぶことを考えます。 スロットマシーンがあなたの前にいくつかあることを考えましょう。(5ことか10ことか) あなたは、決められた回数分(10000回とか)だけこのスロットマシーンをプレイすることができます。 スロットマシーンが当たる確率はスロットごとに異なります。 どのスロットも、当たれば1円儲かり、外れれば何ももらえません。 なので、当たる確率が一番高いスロットを決められた回数分ずーっとプレイし続けるのが一番儲かりますね。 しかし、問題があります。 あなたは、各スロットマシーンの当たる確率がわかりません。 いくつかスロットをプレイすることを通じて、当たりやすいスロットを見つけていくことが必要です。 ここで