エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
「三目並べ」から学ぶ強化学習の本質:新刊ピックアップ
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
「三目並べ」から学ぶ強化学習の本質:新刊ピックアップ
コンピュータープログラムが囲碁や将棋のプロ棋士と対等に戦える時代になりました。囲碁のように,高度... コンピュータープログラムが囲碁や将棋のプロ棋士と対等に戦える時代になりました。囲碁のように,高度な戦略的思考を要するゲームでは,コンピューターが人間のトッププレイヤーに勝つことは難しいと言われていましたが,ついにその常識が変わる時代が来たようです。 −−−と,もっともらしく書き始めてみましたが,実は,私は囲碁にはそれほど詳しくありません。そもそも,囲碁における「高度な戦略的思考」とは何なのでしょうか? 囲碁ファンの皆さんからは,喧喧囂囂(けんけんごうごう)の熱い議論が巻き起こりそうですが,コンピュータープログラムの視点で見ると,少し異なった事情が見えてきます。簡単に言ってしまうと,「取り得る盤面の状態」があまりにも多すぎるのです。少し極端な例かもしれませんが,三目並べ(別名,○×ゲーム)と比較して考えてみましょう。 三目並べの場合,ゲーム中に現れる「○と×の並び方」のパターンはどれほど