タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

dspに関するhagino_3000のブックマーク (2)

  • WSDM 2016 勉強会: Feedback Control of Real-Time Display Advertising - Qiita

    WSDM 2016 勉強会: Feedback Control of Real-Time Display Advertising機械学習MachineLearningアドテク WSDM 2016 勉強会 での発表資料です。次の論文の解説になります。 Feedback Control of Real-Time Display Advertising by Weinan Zhang, Yifei Rong, Jun Wang, Tianchi Zhu, Xiaofan Wang 問題設定 背景 インターネット広告 > ディスプレイ広告 > RTB (Real-Time Bidding) の世界の話 「ディスプレイ広告」は、ここではいわゆる「バナー広告」の類だと思って貰えれば OK バナー広告以外には「検索連動型広告」(Google AdWords など) があるが、こちらはこの論文のスコープ外

    WSDM 2016 勉強会: Feedback Control of Real-Time Display Advertising - Qiita
  • 広告機械学習最前線 DSPの中身を知る

    東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois

    広告機械学習最前線 DSPの中身を知る
  • 1