azma0_0のブックマーク / 2018年3月8日 - はてなブックマーク

azma0_0 id:azma0_0

2018年3月8日のブックマーク (2件)

強化学習入門 Part2 - TensorflowとKerasとOpenAI GymでPolicy Gradientを実装してみよう！ - Platinum Data Blog by BrainPad
本記事は、当社オウンドメディア「Doors」に移転しました。約5秒後に自動的にリダイレクトします。「強化学習入門」の第2弾。今回は、強化学習の手法の一つ「Policy Gradient」について解説しています。加えて、「Policy Gradient」でTensorflow, Keras, OpenAI Gymを使ったCart Poleの実装内容もご紹介しています！こんにちは、AI開発部の高橋です。今回は強化学習の手法の一つであるPolicy Gradientを説明します。そしてTensorflow, Keras, OpenAI Gymを使ってCartPoleを実装してみます。目次目次 1. はじめに 2. 適用例 3. Valued-Basedのおさらい 4. Policy-Based 5. 実装 6. Baseline 7. まとめ 8. 参考文献・コード 1. はじめに強
azma0_0 2018/03/08
強化学習
リンク
ニューラルネットワーク、多様体、トポロジー - Qiita
Christopher Olah氏のブログ記事 http://colah.github.io/posts/2014-03-NN-Manifolds-Topology/ の翻訳です。翻訳の誤りなどあればご指摘お待ちしております。近年、深層ニューラルネットワークには多くの興奮と関心が寄せられています。コンピュータビジョンなどの分野でブレークスルーとなる成果を達成したためです。1 しかし、それにはいくつかの懸念が残ります。そのひとつは、ニューラルネットワークが実際に何をやっているかを理解することが、かなり難問であり得る、ということです。よく訓練されたネットワークは高品質の結果を達成しますが、どのようにしてそうしているかを理解することは困難です。ネットワークが失敗した場合、何がうまくいかなかったかについて理解することは難しいです。一般的に深層ニューラルネットワークの挙動を理解することは困
azma0_0 2018/03/08
機械学習
リンク
- 2018年3月10日
- 2018年3月8日
- 2018年3月7日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx