“深層学習”ではなく“深層強化学習”が決め手　将棋界最強のAlphaZeroと互角の強さ「dlshogi」の秘密

テクノロジーカテゴリーの変更を依頼記事元:

logmi.jp

9 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

“深層学習”ではなく“深層強化学習”が決め手　将棋界最強のAlphaZeroと互角の強さ「dlshogi」の秘密

特徴量を入れて効率的に学習をさせる川島馨氏（以下、川島）：私が作っているdlshogiの特徴を説明しま... 特徴量を入れて効率的に学習をさせる川島馨氏（以下、川島）：私が作っているdlshogiの特徴を説明します。dlshogiでは私個人が趣味でやっていて、Googleみたいな計算資源が大量にあるわけじゃないので、どうやって効率的に学習するかをいろいろ考えて、少し工夫をしています。主な工夫点は、先ほど盤面の画像を用いるという話があったんですが、そこにもう少し将棋で有効な特徴量を入れています。駒の配置以外にも駒の利きの情報や王手の情報を入れることで、もっと効率的に学習するようにしています。先ほど少し言ったとおり、やっぱり終盤が少し弱いので、そこをどうやって克服するかを考えて工夫しています。モンテカルロ木探索の中で、終端で“詰め”の探索をしたり、長手数の詰めの探索はdf-pnという別のアルゴリズムで行なったりしています。強化学習をするときも“詰み”の探索をして、詰みが見つかったらそれを勝ちと

ブックマークしたユーザー

midas365452021/08/15
murasuke2021/04/15
soohkun2021/04/14
mameko3072021/04/14
logtenas2021/04/14

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx