タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

PRMLに関するseapig_dolphinのブックマーク (2)

  • 速水桃子「パターン認識と機械学習入門」

    東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois

    速水桃子「パターン認識と機械学習入門」
  • PRML副読本「パターン認識と機械学習の学習」を出版します | TAKESAKO @ Yet another Cybozu Labs

    2010年~2011年に社内で開催した機械学習勉強会の『パターン認識と機械学習読書会で、光成さんが素晴らしいアンチョコを作ってくれました。PDFファイルは既にgithub 上で公開されていますが、このまま埋もれさせておくのはもったいないということで、暗黒通信団の同人誌として正式に出版されることが決まりました。 ※ 表紙のデザインは今後変更される可能性があります。 目次は以下の通りです。 第 1 章  「序論」のための確率用語 1.1      確率変数は変数なのか..............................  7 1.1.1   確率空間(Ω, F, P).............................  7 1.1.2   σ 加法族.....................................  8 1.1.3   確率変数X..........

    seapig_dolphin
    seapig_dolphin 2012/04/02
    欲しいー
  • 1