タグ

ブックマーク / caesar-wanya.hatenadiary.org (3)

  • 強化学習・MDP - あしたからがんばる ―椀屋本舗

    昨日黒橋研・河原研合同の勉強会で強化学習について話しました。話している中でわかったこともあるので、整理をするため、そのメモなど。 強化学習とは 一般的に言語処理で用いられる教師あり機械学習とは少し異なります。教師あり学習では入力(観測データ)x と出力(正解ラベル)y が与えられ、P(y|x)をどう解くかという問題になります(雑な説明 一方、強化学習においては、入力(観測データ)x に対してモデルからの出力(action)u があり、それによって観測データx がx' へと変化します。その変化に対する報酬関数(reward function)を定義し、その報酬関数を最大化することによってモデルの振る舞いを決定する、というアプローチになります。 強化学習はモデルの振る舞いの系列と、それに対するデータの変化を扱うことができるので、ロボット制御や対話制御などによく用いられます。 強化学習全体を図に

    強化学習・MDP - あしたからがんばる ―椀屋本舗
  • ある分野の研究者となるために - あしたからがんばる ―椀屋本舗

    先日のJUMAN/KNPのラッパーの話の続き。 この前書いたjumanknp.rbはLinuxで書いたのだが、あれをWindowsに持って行ったときに思いがけない罠に嵌った。 Threadから立ち上げたjuman -Sと通信をするとなぜか、 金閣寺について。 金閣寺について。 金閣寺について。 未定義語 15 その他 1 * 0 * 0 NIL EOS みたいな感じで返ってくる。ちなみに期待するのはこんな感じ。 金閣寺 きんかくじ 金閣寺 名詞 6 組織名 6 * 0 * 0 "代表表記:金閣寺/きんかくじ" に に に 助詞 9 格助詞 1 * 0 * 0 "連語" ついて ついて つく 動詞 2 * 0 子音動詞カ行 2 タ系連用テ形 14 "連語" 。 。 。 特殊 1 句点 1 * 0 * 0 NIL EOS 試しに別のプロンプトを立ち上げて、juman -C localhost:

    ある分野の研究者となるために - あしたからがんばる ―椀屋本舗
  • EMNLP・COLING読み会まとめ - あしたからがんばる ―椀屋本舗

    今朝最近恒例の論文紹介(今回はEMNLPとCOLING)の読み会をやった。 僕は昨日(今朝?)の2時くらいまで読む時間がとれず、ぎりぎりになってしまったが(こういう生活もよくないと思う。逆算してLinearにタスクを終われるようになりたい)2紹介した。…が結局あまりきちんと紹介する時間がなくて残念。2ともアイディアは面白かったので、まとめておく。 Inducing Word Senses to Improve Web Search Result Clustering Roberto Navigli; Giuseppe Crisafulli (EMNLP) Multi-Sentence Compression: Finding Shortest Paths in Word Graphs Katja Filippova (COLING) 両方ともグラフを使う話で、前者は語義の曖昧性を解消す

    EMNLP・COLING読み会まとめ - あしたからがんばる ―椀屋本舗
  • 1