東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois
5. 5 目録 ◼ 私の失敗体験談(不均衡データの学習) ◼ 機械学習開発における壁 • 機械学習のビジネスフレームワーク「5D」 • Define(定義する) • Data(データを集める) • Development(開発する) • Deploy(実装する) • Drive(運用する) ◼ ビジネス応用における壁 • AIを使ったキュウリの自動選別 • 機械学習を使って売り上げに貢献する • 機械学習を使わない選択肢 ◼ まとめ 6. 6 目録 ◼ 私の失敗体験談(不均衡データの学習) ◼ 機械学習開発における壁 • 機械学習のビジネスフレームワーク「5D」 • Define(定義する) • Data(データを集める) • Development(開発する) • Deploy(実装する) • Drive(運用する) ◼ ビジネス応用における壁 • AIを使ったキュウリの自動選別 • 機
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く