強化学習勉強会・論文紹介(第30回)Ensemble Contextual Bandits for Personalized RecommendationNaoki Nishimura
![Introduction to contexual bandit](https://cdn-ak-scissors.b.st-hatena.com/image/square/5763f3b1fca4693080c3f3fefef466ac5c7b77fc/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2Fcontexualbandit-131231090706-phpapp02-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)
This article was ported from my old Wordpress blog here, If you see any issues with the rendering or layout, please send me an email. startupsThe software world is always atwitter with predictions on the next big piece of technology. And a lot of chatter focuses on what venture capitalists express interest in. As an investor, how do you pick a good company to invest in? Do you notice quirky names
User-based scoring is great way to automatically moderate user comments, many websites feature some form of upvote/downvote, digg/bury, agree/disagree, happyface/sadface, etc. voting scheme, this post is about reddit's comment system (pictured), which I happen to be quite fond of (albeit, for a multitude of reasons). The most simple, and most popular, form of moderation on such websites is to ran
オバマ大統領の再選に大きく寄与したことで大きな注目を集めているA/Bテスト。A/Bテストを導入した、することを検討している、という開発現場も多いのではないだろうか。 そんな中、Web上で次のような議論を見つけた。 20 lines of code that will beat A/B testing every time Why multi-armed bandit algorithm is not “better” than A/B testing 一言でまとめると「A/Bテストよりバンディットアルゴリズムの方がすごいよ」「いやいやA/Bテストの方がすごいし」ということだ。 で、バンディットアルゴリズムとは一体何者なのか? そこでBandit Algorithms for Website Optimization (O'REILLY)を読んでみた。その結果分かったことを踏まえてざっくりと
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く