はじめに OpenAI gymでオセロを強化学習するための環境を作ってみました。 今後、強化学習の環境を作ってみたい人向けに参考になればと思います。 学習アルゴリズムは未実装です。これから勉強してみます。 コードはこちら https://github.com/pigooosuke/gym_reversi gym/envsには、デフォルトで様々な学習環境が入っています。 ちなみに、ボードゲーム系では、囲碁とhexがあります。 今回は、これらのコードを参考にして作成しました。 作成手順 gym/envs/ 以下にオリジナルの学習環境を作成する gym/envs/__init__.py に作成した環境をデフォルト値と一緒に登録する といった流れになります。 作成したEnvは、以下のように呼び出せるようになります。 Envファイル クラス説明 class ReversiEnv を作成しました 基本