[B! ml][あとで読む] remixedのブックマーク

remixed id:remixed

mlとあとで読むに関するremixedのブックマーク (2)

強化学習の基礎と深層強化学習（東京大学松尾研究室深層強化学習サマースクール講義資料）
東京大学松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です．強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています．巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました．主に以下のような強化学習の概念やアルゴリズムの紹介をしています．・マルコフ決定過程・ベルマン方程式・モデルフリー強化学習・モデルベース強化学習・TD学習・Q学習・SARSA ・適格度トレース・関数近似・方策勾配法・方策勾配定理・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN（Deep Q-Network）・経験再生・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois
remixed 2023/04/02
あとで読む

AI

ML

slideshare

slide
リンク
真面目なプログラマのためのディープラーニング入門
はじめに: 本講座は「機械学習ってなんか面倒くさそう」と感じているプログラマのためのものである。本講座では「そもそも機械が『学習する』とはどういうことか?」「なぜニューラルネットワークで学習できるのか?」といった根本的な疑問に答えることから始める。そのうえで「ニューラルネットワークでどのようなことが学習できるのか?」という疑問に対する具体例として、物体認識や奥行き認識などの問題を扱う。最終的には、機械学習のブラックボックス性を解消し、所詮はニューラルネットワークもただのソフトウェアであり、固有の長所と短所をもっていることを学ぶことが目的である。なお、この講座では機械学習のソフトウェア的な原理を中心に説明しており、理論的・数学的な基礎はそれほど厳密には説明しない。使用環境は Python + PyTorch を使っているが、一度原理を理解してしまえば環境や使用言語が
remixed 2022/03/21
ml

機械学習

あとで読む
リンク
1