[B! プログラミング][統計学] nizimetaのブックマーク

nizimeta id:nizimeta

プログラミングと統計学に関するnizimetaのブックマーク (2)

深層学習用ライブラリを自作して二足歩行を学習させてみた – EL-EMENT blog
WebGLとCUDAで動く深層学習用のライブラリを作って深層強化学習 (Deep Deterministic Policy Gradient, DDPG) で二足歩行を学習させました。学習環境の作成にはOimoPhysicsを使いました。開発の経緯や以下実装方法、学習結果などです。例によって怪しい個所へのツッコミは歓迎です。 >> Open Repository on GitHub これまでの流れ前回の続きです。前回作ったプログラムを拡張してライブラリ化、その上で強化学習を行うプログラムを作成、WebGLとCUDAに対応させて二足歩行を学習といった流れになりました。全結合NNから計算グラフへ前回のプログラムでは全結合ニューラルネットワークに対する偏微分の計算方法をハードコーディングで実装していたため、全結合NN以外のモデルを使った学習ができませんでした。そこで、より一般的なモデルに
nizimeta 2018/07/02
科学

統計学

プログラミング
リンク
自作のニューラルネットワークで遊んでみた – EL-EMENT blog
Deep Learning の初歩中の初歩（？）であるニューラルネットワーク (Neural Network) を自分で実装したときの覚え書きです。本当に何も知らない状態から始めたのでいろいろと大変でしたが、ひとまず形になったのでまとめておきたいと思います。怪しい場所があればツッコミを入れていただけると筆者の勉強になります。こうなった経緯ですが、「物理エンジンでロボットを学習して歩かせたい！」と思ったのがきっかけで強化学習について調べていて行きついたという感じです。ライブラリを使えば比較的簡単にできるのかもしれないですが、どうせなら自分で作りたいよねということで自作する流れになりました。今のロボットはこんな感じです。歩けるようになるといいね。 Neural Network とは Neural Network に関する解説は既に素晴らしいものがネット上に多く存在するのでここに書くのは気
nizimeta 2018/07/02
科学

プログラミング

統計学
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx