遺伝的アルゴリズムxニューラルネットワーク(NeuroEvolution)でOpen AI Gymの二足歩行ロボを歩かせた話遺伝的アルゴリズムMachineLearningDeepLearning強化学習OpenAIGym どうも、オリィ研究所(http://orylab.com/) の ryo_grid こと神林です。 今回は以前試してなかなかうまくいかなかったOpen AI Gymの二足歩行ロボの強化学習へ再チャレンジした話と、その中で知ったNEAT(NeuroEvolution of Augmenting Topologies)という手法について書きたいと思います。 前回のお話 DQN(Deep Q-learning Network)という、強化学習の手法を使って二足歩行ロボを歩かせようとしました。 結果として、学習自体は成されましたが、まともに歩くというところまではいくことができま
![遺伝的アルゴリズムxニューラルネットワーク(NeuroEvolution)でOpen AI Gymの二足歩行ロボを歩かせた話 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/ba21d8a6d869b929a341df08bff39d70798dd03a/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9JUU5JTgxJUJBJUU0JUJDJTlEJUU3JTlBJTg0JUUzJTgyJUEyJUUzJTgzJUFCJUUzJTgyJUI0JUUzJTgzJUFBJUUzJTgyJUJBJUUzJTgzJUEweCVFMyU4MyU4QiVFMyU4MyVBNSVFMyU4MyVCQyVFMyU4MyVBOSVFMyU4MyVBQiVFMyU4MyU4RCVFMyU4MyU4MyVFMyU4MyU4OCVFMyU4MyVBRiVFMyU4MyVCQyVFMyU4MiVBRiVFRiVCQyU4OE5ldXJvRXZvbHV0aW9uJUVGJUJDJTg5JUUzJTgxJUE3T3BlbiUyMEFJJTIwR3ltJUUzJTgxJUFFJUU0JUJBJThDJUU4JUI2JUIzJUU2JUFEJUE5JUU4JUExJThDJUUzJTgzJUFEJUUzJTgzJTlDJUUzJTgyJTkyJUU2JUFEJUE5JUUzJTgxJThCJUUzJTgxJTlCJUUzJTgxJTlGJUU4JUE5JUIxJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz00NjJkNjFhZmM5MzQ2ODlhYjgxZGJkZDU4NjZkN2RkZg%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwcnlvX2dyaWQmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zNiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPTdlZTA1OGZiNjdlMTkwZWY0NDgzY2IyYzJkNWU2YWE1%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D1a965c66869941a38ccd5df6b5907523)