タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

プログラミングと統計学に関するnizimetaのブックマーク (2)

  • 深層学習用ライブラリを自作して二足歩行を学習させてみた – EL-EMENT blog

    WebGLとCUDAで動く深層学習用のライブラリを作って深層強化学習 (Deep Deterministic Policy Gradient, DDPG) で二足歩行を学習させました。学習環境の作成にはOimoPhysicsを使いました。 開発の経緯や以下実装方法、学習結果などです。例によって怪しい個所へのツッコミは歓迎です。 >> Open Repository on GitHub これまでの流れ 前回の続きです。前回作ったプログラムを拡張してライブラリ化、その上で強化学習を行うプログラムを作成、WebGLとCUDAに対応させて二足歩行を学習といった流れになりました。 全結合NNから計算グラフへ 前回のプログラムでは全結合ニューラルネットワークに対する偏微分の計算方法をハードコーディングで実装していたため、全結合NN以外のモデルを使った学習ができませんでした。そこで、より一般的なモデルに

    深層学習用ライブラリを自作して二足歩行を学習させてみた – EL-EMENT blog
  • 自作のニューラルネットワークで遊んでみた – EL-EMENT blog

    Deep Learning の初歩中の初歩(?)であるニューラルネットワーク (Neural Network) を自分で実装したときの覚え書きです。当に何も知らない状態から始めたのでいろいろと大変でしたが、ひとまず形になったのでまとめておきたいと思います。 怪しい場所があればツッコミを入れていただけると筆者の勉強になります。 こうなった経緯ですが、「物理エンジンでロボットを学習して歩かせたい!」と思ったのがきっかけで強化学習について調べていて行きついたという感じです。ライブラリを使えば比較的簡単にできるのかもしれないですが、どうせなら自分で作りたいよねということで自作する流れになりました。 今のロボットはこんな感じです。歩けるようになるといいね。 Neural Network とは Neural Network に関する解説は既に素晴らしいものがネット上に多く存在するのでここに書くのは気

    自作のニューラルネットワークで遊んでみた – EL-EMENT blog
  • 1