[B! dsp] hagino_3000のブックマーク

hagino_3000 id:hagino_3000

dspに関するhagino_3000のブックマーク (2)

WSDM 2016 勉強会: Feedback Control of Real-Time Display Advertising - Qiita
WSDM 2016 勉強会: Feedback Control of Real-Time Display Advertising機械学習 MachineLearningアドテク WSDM 2016 勉強会での発表資料です。次の論文の解説になります。 Feedback Control of Real-Time Display Advertising by Weinan Zhang, Yifei Rong, Jun Wang, Tianchi Zhu, Xiaofan Wang 問題設定背景インターネット広告 > ディスプレイ広告 > RTB (Real-Time Bidding) の世界の話「ディスプレイ広告」は、ここではいわゆる「バナー広告」の類だと思って貰えれば OK バナー広告以外には「検索連動型広告」(Google AdWords など) があるが、こちらはこの論文のスコープ外
hagino_3000 2017/06/06
dsp
リンク
広告機械学習最前線 DSPの中身を知る
東京大学松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です．強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています．巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました．主に以下のような強化学習の概念やアルゴリズムの紹介をしています．・マルコフ決定過程・ベルマン方程式・モデルフリー強化学習・モデルベース強化学習・TD学習・Q学習・SARSA ・適格度トレース・関数近似・方策勾配法・方策勾配定理・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN（Deep Q-Network）・経験再生・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois
hagino_3000 2017/01/17
dsp

ml
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx