タグ

2013年9月13日のブックマーク (2件)

  • 大規模ネットワークの性質と先端グラフアルゴリズム

    東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois

    大規模ネットワークの性質と先端グラフアルゴリズム
  • 平面グラフと交通ネットワークのアルゴリズム - iwiwiの日記

    日,PFI セミナーにて「平面グラフと交通ネットワークのアルゴリズム」というタイトルで話をさせてもらいました.スライドは以下になります. 「平面グラフでは色々な問題が効率的に解けると聞くけど一体何故?」 「道路ネットワークを処理するにはそういうアルゴリズムが使われているの?」 というような自分が昔持っていた疑問に答える,そんなつもりで準備をしました.そんな疑問を持っている方は,是非ご覧ください. 内容は以下のような感じです. 平面グラフのアルゴリズム(理論コミュニティ) 平面グラフとは何か 平面グラフのアルゴリズムテクニックとその応用例 双対グラフ 小さいセパレータの存在 (r-division) グラフ分割 (Deletion Decomposition) 交通ネットワークのアルゴリズム(応用コミュニティ) どのような課題が取り組まれているか 道路ネットワークは平面グラフなのか? 経路

    平面グラフと交通ネットワークのアルゴリズム - iwiwiの日記