サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
パリ五輪
qiita.com/sasakaman
はじめに 練習がてら、PyTorchを使って自作のマインスイーパを機械学習させてみます。 わからないことだらけなので、いろいろと勉強しながらメモ。 一旦メモ書き程度に作成して、必要ならあとから体裁整える。 目標 Windowsの標準(だった)マインスイーパの初級を、安定してクリアできるようになること。 とりあえずは9割ぐらいの勝率を目指す。 構成 こちらのDQNを写経しました。 では済まないので、簡単に。 ネットワークはシーケンシャルモデルを使用。 入力層(状態$s$)と出力層($Q_{s,a}$)のニューロン数は盤の目の数。 隠れ層は2層で、各層のニューロン数は盤の目の数×SIZE_MAG。 とりあえず盤の目の数に対してスケーリングすればいいかなと(適当) 活性化関数はReLU、最適化手法はAdam(学習率0.001)を使用。 マインスイーパは自作。画像取り込んで頑張ろうかと思ったけど、
このページを最初にブックマークしてみませんか?
『qiita.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く