< 強化学習によって学習させたニューラルネットワークを使ったハムレット(4目並べ)ゲームを作った。 だいぶ前からニューラルネットワークとか人工知能とかに興味があったんだけど、なかなかプログラミングする暇がなくてほったらかしにしてた。 そのうち、内容を解説していくつもり。 今回は、そのさわりの部分。 アーキテクチャ アーキテクチャは、ざっくりこんな感じ。 +-----------------+ +-------->lRL Agent | | | | | +---->|[Value Function] | | | +-------------+---+ | | | State | | Reward | Action | | | | | +-----------+ | | +---|Environment|<--+ | | | +-------| | +-----------+ RL Agent
![人工知能はむれっとゲーム -blog-Motivation Driven Development](https://cdn-ak-scissors.b.st-hatena.com/image/square/a0cf335ba71bb9a0c24060d319f4ce02f57b171e/height=288;version=1;width=512/https%3A%2F%2Fimages-fe.ssl-images-amazon.com%2Fimages%2FI%2F51PNPA99TZL.jpg)