こんにちはみなさん 機械学習の理解のため、PHPでニューラルネットを書いてみることをしてみましたが、ここらで強化学習にでも手を出しておきましょう。 とは言っても、実際にはそれほど強いものができませんでしたのが、とりあえず現状できているところまで晒し上げようと思います。 今回五目並べを選択したのは、これを研修課題として出したところ、2ヶ月たってもできなかったというので、そんなことはないだろうと思ってたら、2時間位でできてしまったので、それなら機械学習の例題にしてしまおうと考えただけです。 強化学習 強化学習の詳しい解説については、先人がおりますので、そちらに丸投げしてサボります。 http://qiita.com/icoxfog417/items/242439ecd1a477ece312 大雑把に強化学習は現在の状況に対して、次の行動を機械が自発的に選択できるようになる学習方法で、以下のよう