samurairodeoのブックマーク - はてなブックマーク

ChatGPT 人間のフィードバックから強化学習した対話AI
東京大学の研究室内で，今井がChatGPTの知見を共有するために使用したスライド資料です．特に以下のような話題，技術について解説しています．・ChatGPTの凄さ・ChatGPTの技術・言語モデル・プロンプト・GPTとは・InstructGPT ・言語モデルと強化学習Read less
samurairodeo 2022/12/12
あとで読む
リンク
強化学習の基礎と深層強化学習（東京大学松尾研究室深層強化学習サマースクール講義資料）
東京大学松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です．強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています．巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました．主に以下のような強化学習の概念やアルゴリズムの紹介をしています．・マルコフ決定過程・ベルマン方程式・モデルフリー強化学習・モデルベース強化学習・TD学習・Q学習・SARSA ・適格度トレース・関数近似・方策勾配法・方策勾配定理・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN（Deep Q-Network）・経験再生・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois
samurairodeo 2020/09/30
あとで読む
リンク
1

はてなブックマーク

タグ

ブックマーク / www.slideshare.net/ShotaImai3 (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / www.slideshare.net/ShotaImai3 (2)

ChatGPT 人間のフィードバックから強化学習した対話AI

強化学習の基礎と深層強化学習（東京大学 松尾研究室 深層強化学習サマースクール講義資料）

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

強化学習の基礎と深層強化学習（東京大学松尾研究室深層強化学習サマースクール講義資料）