以下の書籍を参考にGolangでバンディットアルゴリズムを実装してみた。 書籍に載っているEpsilon-Greedy、Softmax、UCB1を実装してから、Epsilon-GreedyとSoftmaxはAnnealingを追加してみた。 書籍ではPythonでtsvファイルを生成してからRで可視化しているけれど、今回はGolangでグラフを描画した。 書籍と同じようなグラフができたので、たぶん同じように実装できているはず。 Annealingを追加したグラフは書籍には載っていないけれど、EpsilonとかTemperatureにあまり影響されない結果になった。 Bandit Algorithms for Website Optimization 作者: John Myles White出版社/メーカー: O'Reilly Media発売日: 2012/12/10メディア: Kindle
![Golangでバンディットアルゴリズムを実装した。 - タチコマ好きなエンジニアのブログ](https://cdn-ak-scissors.b.st-hatena.com/image/square/734ac3a594377512d842c4d50b15cdf32ee107ac/height=288;version=1;width=512/http%3A%2F%2Fecx.images-amazon.com%2Fimages%2FI%2F51I7XbjUYVL.jpg)