エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Pybullet + Chainerを使って強化学習で歩行動作を習得する - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Pybullet + Chainerを使って強化学習で歩行動作を習得する - Qiita
概要 本記事では、4足歩行ロボット(生物?)の歩行動作の学習をPythonを用いて行います。 前提知識とし... 概要 本記事では、4足歩行ロボット(生物?)の歩行動作の学習をPythonを用いて行います。 前提知識として、強化学習の基礎(Q値や報酬、状態、行動、割引率、ポリシー、Actor-Criticなどについて)とニューラルネットワークの基礎(中間層、ニューロン数、学習率、活性化関数、最適化関数などについて)とPythonの基礎文法に関する知識があれば、スムーズに読めると思います。 実行環境 ・Windows10 ・Python3.7.9 ダウンロード ライブラリ 以下のライブラリをpipでインストールしてください。 ・ numpy (数値計算用の便利なやつ) ・ chainer (ディープラーニング用) ・ chainerrl (強化学習の色々なアルゴリズムが実装されている) ・ pybullet (物理エンジン、シミュレータ用) ・ gym (強化学習の環境を楽に定義できる便利なやつ) 今回