タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

強化学習に関するsleepy_yoshiのブックマーク (3)

  • 私のブックマーク: 強化学習

    東京大学 総括プロジェクト機構 牧野 貴樹 はじめに 試行錯誤を通じて環境に適応する学習・制御の枠組みである強化学習について、内容は知らなくとも、耳にしたことのある方は多いと思います。ロボットの制御における行動選択の要として、また、神経科学における報酬・学習のシステムを理解するための鍵として、多くの研究がすすめられている分野です。 ここでは、強化学習の研究に関するページやリソースを紹介します。 強化学習入門 強化学習とは? http://sysplan.nams.kyushu-u.ac.jp/gen/edu/RL_intro.html 九州大学の木村 元先生のページです。web 上で強化学習を日語で勉強したいなら、ここからはじめるといいでしょう。1999年の記事なので、多少古いですが、考え方を理解する入口としては十分な内容です。 Reinforcement Learning: An In

  • 強化学習・MDP - あしたからがんばる ―椀屋本舗

    昨日黒橋研・河原研合同の勉強会で強化学習について話しました。話している中でわかったこともあるので、整理をするため、そのメモなど。 強化学習とは 一般的に言語処理で用いられる教師あり機械学習とは少し異なります。教師あり学習では入力(観測データ)x と出力(正解ラベル)y が与えられ、P(y|x)をどう解くかという問題になります(雑な説明 一方、強化学習においては、入力(観測データ)x に対してモデルからの出力(action)u があり、それによって観測データx がx' へと変化します。その変化に対する報酬関数(reward function)を定義し、その報酬関数を最大化することによってモデルの振る舞いを決定する、というアプローチになります。 強化学習はモデルの振る舞いの系列と、それに対するデータの変化を扱うことができるので、ロボット制御や対話制御などによく用いられます。 強化学習全体を図に

    強化学習・MDP - あしたからがんばる ―椀屋本舗
  • xe-kdoo(2008-04-11)

    >> BMS Starter Pack オフライン期に何故だか「音ゲーやりたい!」熱が高まっていたので、BMS をやることにした。BMS をやるのは、BM98 で DRUNK MONKY [A] の(音無しの)譜面を練習してたころ以来、のような気がする。前世紀末か。 んで、 どっかから辿って BMS Starter Pack 2006 というのを見つけ、やってみる。 その後 BMS Starter Pack 2007 があることを知って、こっちもダウンロード。 と思ったら、BMS Starter Pack 2008 があったのね。←いまここ nazobmplay(Starter Pack に同梱されている BMSプレイヤー)にはインターネットランキング機能がついているので、とりあえず登録してみた。 が。……レベル高ぇ。何曲かやってみたけど、ほとんどが下位5%くらいの順位ですよ。 >> [

  • 1