ブックマーク / tadaoyamaoka.hatenablog.com (1)

  • cshogiをOpenAI Gymインターフェースに対応させてみた - TadaoYamaokaの開発日記

    強化学習の勉強をしていてアルゴリズムを実装して試してみたいが、CartPoleとか学習させても面白くないのでせっかくなので将棋で試せるようにしてみたくなった。 ということで、cshogiをOpenAI Gymインターフェースに対応させてみた。 Gymインターフェース 公式の説明の通りいくつかのインターフェースを実装するだけなので、特に難しいことはなかった。 https://github.com/openai/gym/blob/master/docs/creating-environments.md 別にこのインターフェースを使わなくてもよいのだが、標準的なインターフェースに従っている方が、一般的な強化学習の枠組みに沿うので理論との整合性がとりやすくなると思う。 DQNサンプル 試しにPytorchのチュートリアルのDQNを将棋に適用してみた。 ソース: cshogi_gym/dqn.py

  • 1