[B! 強化学習] KSKSKSKS2のブックマーク

KSKSKSKS2 id:KSKSKSKS2

強化学習に関するKSKSKSKS2のブックマーク (6)

Generative Adversarial Imitation Learningの紹介（RLアーキテクチャ勉強会）
Generative Adversarial Imitation Learning の紹介スライド実装コード: https://github.com/uidilr/gail_ppo_tf
KSKSKSKS2 2018/06/05
GANを用いた模倣学習のアルゴリズム

機械学習

強化学習

deep learning
リンク
GAN（と強化学習との関係）
This document discusses generative adversarial networks (GANs) and their relationship to reinforcement learning. It begins with an introduction to GANs, explaining how they can generate images without explicitly defining a probability distribution by using an adversarial training process. The second half discusses how GANs are related to actor-critic models and inverse reinforcement learning in re
KSKSKSKS2 2018/06/05
GANと強化学習の類似点について記載

機械学習

強化学習

deep learning
リンク
Faster physics in Python
We’re open-sourcing a high-performance Python library for robotic simulation using the MuJoCo engine, developed over our past year of robotics research. This library is one of our core tools for deep learning robotics research, which we’ve now released as a major version of mujoco-py, our Python 3 bindings for MuJoCo. mujoco-py 1.50.1.0 brings a number of new capabilities and significant performan
KSKSKSKS2 2017/07/09
強化学習

機械学習

フレームワーク

シミュレーション
リンク
GitHub - yandexdataschool/Practical_RL: A course in reinforcement learning in the wild
The syllabus is approximate: the lectures may occur in a slightly different order and some topics may end up taking two weeks. week01_intro Introduction Lecture: RL probl ems around us. Decision processes. Stochastic optimization, Crossentropy method. Parameter space search vs action space search. Seminar: Welcome into openai gym. Tabular CEM for Taxi-v0, deep CEM for box2d environments. Homework d
KSKSKSKS2 2017/04/02
強化学習のオンライン講座資料

機械学習

強化学習

deep learning
リンク
ゼロからDeepまで学ぶ強化学習 - Qiita
ロボットから自動運転車、はては囲碁・将棋といったゲームまで、昨今多くの「AI」が世間をにぎわせています。その中のキーワードとして、「強化学習」というものがあります。そうした意味では、数ある機械学習の手法の中で最も注目されている(そして誇張されている・・・)手法ともいえるかもしれません。今回はその強化学習という手法について、基礎から最近目覚ましい精度を出しているDeep Q-learning(いわゆるドキュン、DQNです)まで、その発展の流れと仕組みについて解説をしていきたいと思います。本記事の内容をベースに、ハンズオンイベントを開催しました(PyConJPのTalkの増補改訂版) Pythonではじめる強化学習 OpenAI Gym 体験ハンズオン講義資料の方が図解が豊富なので、数式とかちょっと、という場合はこちらがおすすめです。 Tech-Circle #18 Pythonではじ
KSKSKSKS2 2016/06/15
機械学習

deep learning

強化学習
リンク
DQNの生い立ち　＋　Deep Q-NetworkをChainerで書いた - Qiita
はじめにそもそもDQNが作りたかったわけじゃなくて、他の目的でChainerを使いたかったのでその練習にDQNを書いたんですが、せっかくだし公開しようと思いました公開しました。またどうせ公開するなら、この機会にこれ（Q学習+関数近似）関連で持っている知識をついでに整理しようと思ってまとめました。ニュース記事とかNatureとかNIPSの論文だけ読むと、DQN作ったDeepmind/Googleすげー！！！って感覚になりそうですが、強化学習的な歴史的経緯を考えると強化学習+深層学習になった、むしろかなり当然の成り行きで生まれた技術であることがわかります。（ATARIのゲームを人間以上のパフォーマンスでプレイするというのがビジュアル的にわかりやすかった$\leftrightarrow$問題設定が良かったというのもあります。）この記事ではNIPSとNatureの以下の２本の論文・ V
KSKSKSKS2 2016/05/20
機械学習

deep learning

強化学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx