市販の強化学習関連の書籍は、アルゴリズムの中身を解説する物が多く、業務システムなどのカスタムSIへの適用を検討するエンジニアにとっては、なかなか理解しにくい構成の事が多い。本スライドでは、強化学習を使って機能を実装することを主眼においた解説を行った。おそらく現時点ではもっとも簡単に設計・実装できるスキーム、Stable Baselines/OpenAI Gym を使ってじゃんけんAIを設計・実装する流れを解説している。極力数式やアルゴリズムの中身についての解説については解説していないので、市販の書籍などの別のコンテンツを参照のこと。
![C#/.NETがやっていること 第二版](https://cdn-ak-scissors.b.st-hatena.com/image/square/246827b76f5f2cf508d8231c18e8af96875c0568/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2Fhowcdoes-140628213022-phpapp01-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)