報酬がベルヌーイ分布に従うときのThompson Sampling - くじらにっき++

テクノロジーカテゴリーの変更を依頼記事元:

kujira16.hateblo.jp

2 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

報酬がベルヌーイ分布に従うときのThompson Sampling - くじらにっき++

報酬がベルヌーイ分布に従うときのThompson Samplingの追試をだいぶ前にやったのですが，あまり受けが良... 報酬がベルヌーイ分布に従うときのThompson Samplingの追試をだいぶ前にやったのですが，あまり受けが良くなかったのでブログで供養をしていきます。問題設定 Thompson Samplingは多腕バンディット問題に対する方策の1つです。多腕バンディット問題については良い解説記事やスライドがたくさんあるので，興味がある人はググってみてください。以下のようなデモもあります*1。 https://arosh.github.io/multi-armed-bandit/ 行ったのはChapelleらのNIPS 2011の論文 [1] の中の実験の1つの追試で，報酬がのベルヌーイ分布に従うアームが1本，のベルヌーイ分布に従うアームが99本あるという設定です。原理 Thompson Sampling では個々のアームを引いたときに当たりが出た回数，外れが出た回数を記録しておきます

ad
python

ブックマークしたユーザー

syou61622018/03/02
abrahamcow2017/05/02

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx