[B! 強化学習] sleepy_yoshiのブックマーク

sleepy_yoshi id:sleepy_yoshi

強化学習に関するsleepy_yoshiのブックマーク (3)

私のブックマーク: 強化学習
東京大学総括プロジェクト機構牧野貴樹はじめに試行錯誤を通じて環境に適応する学習・制御の枠組みである強化学習について、内容は知らなくとも、耳にしたことのある方は多いと思います。ロボットの制御における行動選択の要として、また、神経科学における報酬・学習のシステムを理解するための鍵として、多くの研究がすすめられている分野です。ここでは、強化学習の研究に関するページやリソースを紹介します。強化学習入門強化学習とは? http://sysplan.nams.kyushu-u.ac.jp/gen/edu/RL_intro.html 九州大学の木村元先生のページです。web 上で強化学習を日本語で勉強したいなら、ここからはじめるといいでしょう。1999年の記事なので、多少古いですが、考え方を理解する入口としては十分な内容です。 Reinforcement Learning: An In
sleepy_yoshi 2012/05/04
ML

強化学習
リンク
強化学習・MDP - あしたからがんばる ―椀屋本舗
昨日黒橋研・河原研合同の勉強会で強化学習について話しました。話している中でわかったこともあるので、整理をするため、そのメモなど。強化学習とは一般的に言語処理で用いられる教師あり機械学習とは少し異なります。教師あり学習では入力(観測データ)x と出力(正解ラベル)y が与えられ、P(y|x)をどう解くかという問題になります(雑な説明一方、強化学習においては、入力(観測データ)x に対してモデルからの出力(action)u があり、それによって観測データx がx' へと変化します。その変化に対する報酬関数(reward function)を定義し、その報酬関数を最大化することによってモデルの振る舞いを決定する、というアプローチになります。強化学習はモデルの振る舞いの系列と、それに対するデータの変化を扱うことができるので、ロボット制御や対話制御などによく用いられます。強化学習全体を図に
sleepy_yoshi 2011/04/17
強化学習
リンク
xe-kdoo(2008-04-11)
>> BMS Starter Pack オフライン期に何故だか「音ゲーやりたい！」熱が高まっていたので、BMS をやることにした。BMS をやるのは、BM98 で DRUNK MONKY [A] の（音無しの）譜面を練習してたころ以来、のような気がする。前世紀末か。んで、どっかから辿って BMS Starter Pack 2006 というのを見つけ、やってみる。その後 BMS Starter Pack 2007 があることを知って、こっちもダウンロード。と思ったら、BMS Starter Pack 2008 があったのね。←いまここ nazobmplay（Starter Pack に同梱されている BMSプレイヤー）にはインターネットランキング機能がついているので、とりあえず登録してみた。が。……レベル高ぇ。何曲かやってみたけど、ほとんどが下位5%くらいの順位ですよ。 >> [
sleepy_yoshi 2010/02/23
強化学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx