タグ

ブックマーク / yaneuraou.yaneu.com (24)

  • テラショック定跡の生成手法 | やねうら王 公式サイト

    先日100テラショック定跡を公開した。記事では、その生成手法について詳しく書く。 ※ 100テラショック定跡、公開しました ■ 従来手法 コンピュータ将棋の定跡生成手法として現在最先端の手法はshotgun方式と呼ばれるものである。 これはSDT5(第5回将棋電王トーナメント)で準優勝したshotgunおよび、WCSC28(第28回世界コンピュータ将棋選手権)で優勝したHefeweizenの用いていた定跡生成手法である。 ■ shotgun方式 shotgunの手法については次の論文に詳しい。 ※ コンピュータ将棋における定跡生成法の一提案 : https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_uri&item_id=192055&file_id=1&file_no=1 ■ テラショック定跡とshotgun方式との比較 また、テラショック

    honeybe
    honeybe 2019/04/23
  • 最新の将棋ソフトが2手目34歩を悪手だと言い始めた件 | やねうら王 公式サイト

    近年の将棋ソフトは2倍の思考時間を使えばR200程度強くなる。ということは、家庭用PCで15分切れ負けの対局でR4300程度だと言われている最新ソフトを自己対局させるとして、片方のソフトだけ持ち時間をその倍である30分を与えるとどうなるだろう? そのソフトは、見かけ上、R4300 + R200 = R4500ぐらいの強さを発揮するわけであるな。 では、もっと桁違いの時間を与えるとどうだろう? 15分切れ負けのとき、序盤の1手には10秒ぐらいしか使わないが、その序盤の特定の局面に対して、1,000倍の時間(10,000秒)を与えれば、そのときの棋力はどれだけになるだろう? log(2)1024 = 10なので、10×R200 = +R2000ぐらい強くなり、R4300 + R2000 = R6300のソフト相当になるのではなかろうか。 R6300のインパクトが強すぎてどれくらいの強さなのか想

    honeybe
    honeybe 2019/04/14
  • フロッピーディスクに収まる評価関数バイナリ公開しました | やねうら王 公式サイト

    NNUE評価関数は、ネットワーク構成を簡単にカスタマイズできるようになっている。 そこで、入力をK(玉のいる升)とP(どの升にどの駒がいるかに対応する値)だけにして(81升 + 1629通り = 1710)、hidden層の1層目を256×2、2層目・3層目を32にして学習させた。(K-P-256-32-32) NNUEを知らない人のために書くと、各層は全結合。 ※ 補足 : ニューラルネットの入力は、駒が存在するところを1、存在しないところを0とした1710次元のベクトル。 教師はdepth 8で生成した10億局面から学習させてみたところ、elmo – R30程度になった。 ファイルサイズは873KB。(zipで圧縮して400KB程度) 教師をもう少し深いdepthで生成すれば、まだ強くなるはず。 とりあえず公開しておいた。 https://github.com/yaneurao/Yan

    honeybe
    honeybe 2019/01/16
  • DeepMind社がやねうら王に注目し始めたようです | やねうら王 公式サイト

    DeepMindがAlphaGo Zeroで使われた手法をチェスと将棋に適用して、チェスと将棋の世界でもぶっちぎり強いソフトが出来たそうです。(私は、内容は詳しく読んでいません。) おーDeepMindの論文にelmoデビューしとる。でもElmoって書いてあるから個人的にリジェクトで。しかし強い。DeepMind凄いね。https://t.co/o5SmgmH6KG — 瀧澤 誠@elmo (@mktakizawa) December 6, 2017 RT> DeepMindの論文にやねうら王の文字があるんだけどw 何か知らないけど、やねうら王、世界的にデビューしてた!! pic.twitter.com/HVb1CZKue6 — やねうら王 (@yaneuraou) December 6, 2017 まあ、ResignValue = 900 (評価値が-900を下回った時点で投了扱い)にな

    honeybe
    honeybe 2017/12/07