タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

algorithmに関するsakurasakurasのブックマーク (2)

  • 多腕バンディット問題とUCB解説

    以下は登場する数式を(なるべく)直感的に(厳密性をけっこう犠牲にして)解釈したもの。数式多め。簡単のため台は2個とします(K=2)。 補足1 収入をxとして、期待値がベストな台の収入の確率分布を、ベストでない適当な台iの収入の確率分布をとします。 このとき分布をもつベストな台があたかもベストでない台であるかのような振舞いを示す確率というのは漸近的に で与えられるという理論があります(大偏差原理。Dは相互情報量で、分布から見た分布の「遠さ」を表す)。 さて現状で平均収入がベストだったのが台0だったとして、そのプレイ回数を、(理論的な)期待値をとします。また、もう一方の台1のプレイ回数を、期待値をとします(基的には平均収入が多い台をプレイしていくため)。ここで「台1が実はベスト」ということの「確率」はどれくらいか?ということを考えてみます。 台1に比べて台0は十分試行回数が大きいため、台0は

    多腕バンディット問題とUCB解説
  • バンディットアルゴリズムによる最適化手法

    書は、「多腕バンディット問題」と呼ばれる問題を解くためのアルゴリズムを、Webサイトの最適化という例をもとに解説する書籍です。 バンディットアルゴリズムに関する基的な知識について、既存研究についての理解を十分に得て、多腕バンディット問題についての資料を自力で読めるようにすることを目的としています。 A/Bテストのような2者択一ではなく、新しいアイデアの探索と、既存のアイデアから最大限の利益を引きだすという矛盾する2つの問題を解決するための一助となるでしょう。なお書はEbookのみの販売となります。 yuku_tさんによる書の英語版とバンディットアルゴリズムに関するまとめ http://qiita.com/yuku_t/items/6844aac6008911401b19 まえがき 1章 2種類のキャラクター:「探求」と「活用」 科学者とビジネスマン 「探求」と「活用」のジレンマ 2

    バンディットアルゴリズムによる最適化手法
  • 1