エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
AlphaGo Zeroの論文を読む その5(ドメイン知識) - TadaoYamaokaの開発日記
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
AlphaGo Zeroの論文を読む その5(ドメイン知識) - TadaoYamaokaの開発日記
前回までで、実装に必要な内容についてほぼ解説しました。 今回は、補足的な内容です。 ドメイン知識 論... 前回までで、実装に必要な内容についてほぼ解説しました。 今回は、補足的な内容です。 ドメイン知識 論文には以下の一文が記載されている。 Our primary contribution is to demonstrate that superhuman performance can be achieved without human domain knowledge. 「私たちの主な貢献は、人間の知識なしに超人的なパフォーマンスが達成できることを示すことです。」 人間の知識を用いないということが、この技術が囲碁に特化しない汎用的な技術であることを示している。 それを明確にするために、使用したドメイン知識を列挙している。 使用したドメイン知識 囲碁のルール: シミュレーションの終端状態でのスコア付け ゲームの終了条件 各局面での合法手 MCTSシミュレーション中にTromp-Taylorス