ブックマーク / yaneuraou.yaneu.com (11)

  • チェスAIはNNUE導入以降、どう変わったのか? | やねうら王 公式サイト

    やねうら王の評価関数にNNUE(差分計算可能な3層程度の全結合ニューラルネットワーク)が採用されて数年の時を経たのちに、チェスのAIであるStockfishにNNUEが導入された。 これによってチェスの世界はどのように変わったのであろうか? 将棋AIの世界ではNNUEが導入されて、確かに強くなったが「棋風がこう変わった」みたいなのはあまり聞かないのだけど、チェスの世界ではどうもそれとは様子が異なるようである。 将棋AIも、もしかしたらNNUE導入前と導入後とでは棋風が当は大きく違ってるのだけど、それをレビューしている人がいないだけという可能性もある。将棋AIの棋風のレビューを気でやっているライターの人はいないと思うのだけど、チェスAIだとそういうライターの人がおられるようであるから、そのへんの事情はあるのかも知れない。 あとは、将棋AIではNNUE以前はKPP(三駒関係)型の評価関数が

    quwachy
    quwachy 2024/04/08
  • チェスAIが探索なしでグランドマスターレベルに到達した件 | やねうら王 公式サイト

    Google DeepMind社がtransformerを用いたチェスAIで、探索なしにグランドマスターレベルに到達したという論文を発表した。 Grandmaster-Level Chess Without Search : https://arxiv.org/abs/2402.04494 ちなみに上の論文には私の名前も入っている。 チェスAIのStockfishの主要開発者として名前を入れてもらった感じでありがたい限りである。(StockfishのGitHubにプルリクしたことすらないのにな…) 将棋AIの方も、2022年にPolicy Networkだけの指し手を指すことで二番絞り(ソフト名)が、アマ四段ぐらいの強さになっているという記事をこのブログで書いた。 PolicyNetworkだけの将棋ソフトの強さは? : https://yaneuraou.yaneu.com/2022/0

    quwachy
    quwachy 2024/02/11
    トランスフォーマーベースならLLMに追加学習させれば手の解説もできるようにならないかな、プログラムだと何やってるか解説してくれるけど
  • クラウド最安のGPUについて | やねうら王 公式サイト

    渡辺名人が購入した130万円のパソコン、クラウドでそれと同じ性能のもの、1時間50円で使えるよとツイートしたらえらくバズった。 上のツイートは、決して渡辺名人の研究を揶揄するものではなく、書き方次第で最低にも最高にも聞こえるという、そういう物事の二面性みたいなのって面白いよねという意味でツイートしたわけである。 しかし「クラウドの料金そんなに安くねーだろ」「それってGPUだけの値段ですよね?」「値段一桁間違えてない?」「クラウド使ったことない奴の妄想乙」みたいなツッコミをたくさん頂戴している。

    quwachy
    quwachy 2022/07/03
    そもそも、名人のパソコンが高いのはCPUがスリッパだからでしょ。GPUだけなら60万くらいで作れるしGPUだけケチっても40万くらいしか浮かない。仮にGPUだけクラウドに投げるとして、1年でトントンなら買った方がいい。
  • 誰もdlshogiには敵わなくなって将棋AIの世界が終わってしまった件 | やねうら王 公式サイト

    いま大会上位に位置するDeep Learning系の将棋AIは、評価関数として画像認識などでよく使われているResNetを用いている。ResNetについては機械学習を齧っている人ならば誰でも知ってるぐらい有名だと思うので、詳しい説明は割愛する。(ググれば詳しい説明がいくらでも出てくる) 囲碁AIの世界では、このResNetのブロック数を大きくしていくのが一つの潮流としてある。ブロック数が多いと言うことは、より層の数が増え(よりdeepになり)、1局面の評価に、より時間を要するようになるということである。それと引き換えに評価精度がアップするから、トータルでは得をしていて、棋力が向上するというわけである。 ところが大きいブロック数になればなるほど学習に要する教師局面の数が増える。学習もブロック数に応じた時間を要するようになるから、そう簡単に大きくはできない。しかし囲碁AIの方は、中国テンセント

    quwachy
    quwachy 2022/07/02
    電王戦が終わったようにWCSCも数年で終わりそう。数億の資本がなきゃ勝てないんじゃ個人には無理
  • 将棋で後手が途中で先後を選べるルール | やねうら王 公式サイト

    いまの将棋ソフト、人間からすると強くなりすぎて、ソフトの大会での先手勝率が高すぎることが問題になりつつある。例えば、先日の電竜戦では、先手勝率70.0%、後手勝率25.6%であった。 世界将棋AI 電竜戦が今日から開催される https://yaneuraou.yaneu.com/2021/11/20/the-world-shogi-ai-denryu-tournament-starts-today/ そこで、先手と後手が公平になるようなルールを考えようというのがこの記事の趣旨である。 二手ずつ指す コネクト6(6目並べ)は、先手が1手打ったあとは、後手、先手が交互に2手ずつ打っていく。 コネクト6(Wikipedia) https://ja.m.wikipedia.org/wiki/%E3%82%B3%E3%83%8D%E3%82%AF%E3%83%886 この方式、将棋でもできるか(た

    quwachy
    quwachy 2022/01/02
    smeg 成立はするが引き分けが多くなる
  • スーパーテラショック定跡が76歩に34歩を全否定 | やねうら王 公式サイト

    前回までのあらすじ) 先手番専用定跡s-book_blackが優秀すぎた。私が2年前に開発したテラショック定跡生成手法では到底太刀打ちできなかった。そこでやねうら王プロジェクトでは、新たにスーパーテラショック定跡生成手法というのを考案し、やねうら王に実装したのであった。 前回記事 : 先手番専用定跡s-book_blackの厚い壁 https://yaneuraou.yaneu.com/2021/11/01/thick-walls-of-s-book_black/ テラショック定跡生成手法のおさらい まず簡単にテラショック定跡手法をおさらいし、何が悪かったのかを書き、今回それをどう改善したのかを書く。 テラショック定跡は与えた棋譜の各局面に対して長い時間をかけて思考させる。1局面につき探索1スレッド×1時間でやっていた。1スレッドにしているのは、将棋ソフトは並列化効率が悪いからで、スレッド

    quwachy
    quwachy 2021/11/07
    藤井聡太「知ってた」
  • WCSC31にはDL勢しか決勝日に残らない(予言) | やねうら王 公式サイト

    やねうら王の定跡生成のためにMCTS(モンテカルロ木探索)の探索部書いてたんですよ。まあ、半日ぐらいでだいたい書けて、ふと思ったんです。あれ?これ、dlshogiの評価関数呼び出せるようにしたら、dlshogiなんじゃね?と。 dlshogiの評価関数を呼び出すコードは、dlshogiからコピペしてくるだけで済みます。dlshogiのC++版は指し手生成などAperyのコードを利用しています。それゆえ、特徴量などはAperyと同じ駒番号(BonaPiece)になっていると思うので、この部分は、やねうら王と全く同じです。 ということは、dlshogiのコード、コピペしてくればdlshogiの評価関数が呼び出せるということです。MCTS + dlshogiの評価関数 = dlshogiです。dlshogiを半日で作った(移植した?)男、爆誕です! // 学習部も何もないので、語弊がある。あとで

    quwachy
    quwachy 2020/12/08
    だろうね
  • 読み筋が合流するのに評価値が違う件 | やねうら王 公式サイト

    AbemaTVの放送で、AIの出力する候補手1と2の読み筋が途中で合流して同じ局面になるはずなのに評価値が1と2で異なるという状況があったらしく、それを解説していたプロの先生が「これはおかしいですね」とか何とかおっしゃっていたそうなのですが、これについて解説します。 やねうら王を始めとするいまどきの将棋ソフトの思考エンジンは、複数の候補手を出力するMultiPVという機能があります。AbemaTVの思考エンジンもこのMultiPVを用いて出力しているのだと思われます。 予測される状況1 ところが、AbemaTVのSHOGI AIでは、複数エンジンの評価値を組み合わせて期待勝率を出しているようです。 なので、 ・エンジン1が、候補手A,B,C ・エンジン2が、候補手A,C,D ・エンジン3が、候補手A,C,D のように候補手を出力した場合、候補手Aは、3つのエンジン(が候補手Aを指した時)の

    quwachy
    quwachy 2020/10/29
    飛車先切れてる状態で単に29飛車より24歩合わせて29に引く方が評価値高くなる謎現象の理由がわかった
  • 強化学習用の教師生成時のランダムムーブについて | やねうら王 公式サイト

    将棋AIの強化学習では自己対局を用いるが、その時に同一の棋譜ができてしまわないように何らかの工夫が必要である。 1) floodgateのような大量の実戦棋譜の任意の局面から開始する 2) 定跡を用意して、ランダムに定跡を採択する 3) 初手から数手、ランダムムーブを入れる 4) 序盤では最善手と評価値(or 期待勝率)がさほど離れていない指し手のなかからランダムに選択する 2016年~2017年ごろのやねうら王は、人間の棋譜を用いないということにこだわっていたので3)にしていた。いまどきの主流が1)なのか2)なのかは知らないが、AlphaZeroに影響を受けている人は4)が多いように思う。2018年は1)を試してみた。そちらのほうが少し強くなった。 それで、これに関して、なんとかちゃんねるに気になる投稿があったので引用する。 634名無し名人 (ワッチョイ 0234-3XbD)2020/

    quwachy
    quwachy 2020/10/29
    受験勉強したことあるなら誰でも知ってるからそれ、高一で東大理3A判定余裕でしたみたいのは知らんけど
  • 3年以上誰も発見できなかった探索部のbugがRustによって見つかったという話 | やねうら王 公式サイト

    だいたいにおいて、やねうら王ほどメジャーな将棋ソフトの探索部に大きなバグを埋め込むことは常識的に考えると不可能である。多くの人が改良に参加している&参考にしているので、誰かの目に止まるはずではある。ところが、公開後、数年も誰も気づかなかったbugがつい先日見つかった。Aperyの平岡さんが、AperyをRustで書き直している時にRustのコンパイラが警告を出したので気づいたと言うのだ。(WCSC29の会場で平岡さんから直接教えてもらった。) bugの詳しい内容 ここから少し専門的な話が出てくる。プログラマでない人は次の見出しまで読み飛ばすこと推奨。 – Position::move16_to_move()のbug fix。thx.平岡さん https://github.com/yaneurao/YaneuraOu/commit/9e6ba09029839838e10cd928456935

    quwachy
    quwachy 2019/05/26
    Lisp Shogi << Rust Shogi なのか
  • 電王戦 第三局の感想 | やねうら王 公式サイト

    大阪戻ってきました!開発者サイドの感想として書きたいこと、書かなければならないことはたくさんありますが、取り急ぎ、開発者だから言えることを4つだけ書きます。 27歩は悪手ではない可能性 譜、27銀成とやねうら王が2筋を突破してそこでやねうら王の評価値がプラスに転じたと記者会見で私が言ったこともあってか、直前の先手の27歩が攻めを呼び込んだ悪手であったかのように言われています。(「27歩で攻めを呼び込んで何がしたかったんだ?」etc…) しかし、この時点ではやねうら王の評価値的には優勢ではなく、微差でした。 やねうら王は飛車を成ってもまだ形勢をほぼ互角と見ていました。 つまり、飛車を成らせたこと自体は悪くなく、74歩〜85桂の攻めが一つの勝負どころだったのかなと私は捉えています。そしてそのあとの49桂で、ここで急激にやねうら王の評価値が上がりました。やねうら王は49桂に代えて39銀打で難し

    quwachy
    quwachy 2015/03/30
    300億というとGPS2分程度の読みか、
  • 1