sbg3のブックマーク / 2017年11月16日

sbg3 id:sbg3

2017年11月16日のブックマーク (2件)

逆強化学習を理解する - Qiita
逆強化学習一般的な強化学習では、エージェントが環境からの報酬を得ることで最適な行動を獲得します。しかし現実の問題においては、この報酬を設計することが困難な場合があります。例えば運転技術を獲得する場合、うまい運転というのはただ目的地に速く着くだけでなく、急発進・急ブレーキしない、混んでなさそうな道を選ぶなど実際の報酬関数として考慮しづらい要素が存在します。逆強化学習ではエキスパートによる行動から報酬を推定することによって、このような表現しにくい報酬を求めることができます。逆強化学習の手法この記事では逆強化学習の手法としてよく取り上げられる手法の中で以下の3つについて解説したいと思います。線形計画法を用いた逆強化学習 Maximum Entropy IRL Maximum Entropy Deep IRL マルコフ決定過程(MDP) 逆強化学習に入る前にまずMDPについて説明しま
sbg3 2017/11/16
deep learning
リンク
Haskellの入門から中級者になるまでの指針 - Qiita
プログラミング言語の学習は一般に大変である。最初にどのようなことをすればいいのか、どの本をよむべきなのか等疑問は尽きない。マイナーな言語で情報が少なければなおさらである。この記事では諸事情でHaskellに入門することになった方にむけて、どのように勉強していくか、参考にすべき本や記事を紹介する。より良い指針にするためにも、指摘、感想等はコメントや私のTwitterアカウント(@Lugendre)に投稿して頂けるとありがたい。入門〜初心者環境構築まずどんなプログラミング言語においても、プログラミングをする環境が必要である。Haskellにおいては Stackと呼ばれるツールをインストールすることによって、コンパイラ(GHC)、モジュールのインストール、ビルドなど自動でやってくれるようになるので、とりあえず脳死でStackをインストールしておけば良い。以下の@igrepさんの記事
sbg3 2017/11/16
haskell

study

programming
リンク
- 2017年11月22日
- 2017年11月16日
- 2017年11月15日