[B! 強化学習][機械学習] ronekkoのブックマーク

REINFORCEjs: Gridworld with Dynamic Programming

# About **REINFORCEjs** is a Reinforcement Learning library that implements several common RL algorithms supported with fun web demos, and is currently maintained by [@karpathy](https://twitter.com/karpathy). In particular, the library currently includes: ### Dynamic Programming For solving finite (and not too large), deterministic MDPs. The solver uses standard tabular methods will no bells and w

ronekko 2015/07/25

リンク

DQNの生い立ち　＋　Deep Q-NetworkをChainerで書いた - Qiita

はじめにそもそもDQNが作りたかったわけじゃなくて、他の目的でChainerを使いたかったのでその練習にDQNを書いたんですが、せっかくだし公開しようと思いました公開しました。またどうせ公開するなら、この機会にこれ（Q学習+関数近似）関連で持っている知識をついでに整理しようと思ってまとめました。ニュース記事とかNatureとかNIPSの論文だけ読むと、DQN作ったDeepmind/Googleすげー！！！って感覚になりそうですが、強化学習的な歴史的経緯を考えると強化学習+深層学習になった、むしろかなり当然の成り行きで生まれた技術であることがわかります。（ATARIのゲームを人間以上のパフォーマンスでプレイするというのがビジュアル的にわかりやすかった$\leftrightarrow$問題設定が良かったというのもあります。）この記事ではNIPSとNatureの以下の２本の論文・ V

ronekko 2015/07/12

リンク

私のブックマーク: 強化学習

東京大学総括プロジェクト機構牧野貴樹はじめに試行錯誤を通じて環境に適応する学習・制御の枠組みである強化学習について、内容は知らなくとも、耳にしたことのある方は多いと思います。ロボットの制御における行動選択の要として、また、神経科学における報酬・学習のシステムを理解するための鍵として、多くの研究がすすめられている分野です。ここでは、強化学習の研究に関するページやリソースを紹介します。強化学習入門強化学習とは? http://sysplan.nams.kyushu-u.ac.jp/gen/edu/RL_intro.html 九州大学の木村元先生のページです。web 上で強化学習を日本語で勉強したいなら、ここからはじめるといいでしょう。1999年の記事なので、多少古いですが、考え方を理解する入口としては十分な内容です。 Reinforcement Learning: An In

ronekko 2011/06/06

リンク

はてなブックマーク

タグ

関連タグで絞り込む (4)

強化学習と機械学習に関するronekkoのブックマーク (3)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (4)

強化学習と機械学習に関するronekkoのブックマーク (3)

REINFORCEjs: Gridworld with Dynamic Programming

DQNの生い立ち ＋ Deep Q-NetworkをChainerで書いた - Qiita

私のブックマーク: 強化学習

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

DQNの生い立ち　＋　Deep Q-NetworkをChainerで書いた - Qiita