タグ

ブックマーク / yaneuraou.yaneu.com (17)

  • WCSC34、技術的まとめ | やねうら王 公式サイト

    去る5月3日~5日に開催された第34回世界コンピュータ将棋選手権(以下WCSC34と略す)について、私の視点で書きたいことをいくつか書いておきたい。 今回、優勝したのは「お前、CSA会員にならねーか?」(以下、たぬきと記す)である。この作者は、たぬきシリーズの作者の野田さん(nodchip)だ。 関連記事 : その名は「お前、CSA会員にならねーか?」2024年・世界コンピュータ将棋選手権、チャンピオン決定!(Yahooニュース) : https://news.yahoo.co.jp/expert/articles/3490be9ce374b0afe114ca3d6e5a422d0db85923 今回のたぬきは、Deep Learning型の将棋AIではなく、従来型(NNUE系と言われている)の将棋AIである。 nnue-pytorchについて 今年に入ってから、NNUE系はいくつかの大き

    BigHopeClasic
    BigHopeClasic 2024/05/07
    ここ1年くらいはコンピュータ将棋も停滞期に入りそうな空気あったのに、また強くなったことを大変うれしく思う
  • その打ち歩詰めの定義、間違ってません? | やねうら王 公式サイト

    まず、「◯◯角不成」となる1手詰め問題が作れるかについて考えてもらいたい。普通に考えると、(1手詰めで)例えば5二角不成で詰むなら、5二角成でも詰むはずであって、5二角不成でなければならないという状況は考えられない。ところが、それに挑戦する非常に面白い詰将棋問題が出題された。 いろいろあってやり場が無くなったのでここにあげておきます。良かったら解いてやってください。一手です。 https://t.co/IYB5Qx5dKv pic.twitter.com/hER6oCsK0y — Tonkatu (@tonkatu_love33) November 10, 2023 作意としては、68角不成。対して、77歩のあと、先手に合法手がない。つまり、歩を打つことで相手を合法手のない状態にしているので、これは打ち歩詰めであり、77歩は禁じ手であると言うのだ。(68角不成に代えて68角成だと、77歩の

    BigHopeClasic
    BigHopeClasic 2023/11/16
    俺は将来的には将棋も引き分けを増やさないとトップレベルでは競技性が破綻する可能性を考えているので、実現可能性がほぼ皆無としてもステイルメイトは明文でルール化してほしいと思ってる。
  • スーパーテラショック定跡が76歩に34歩を全否定 | やねうら王 公式サイト

    前回までのあらすじ) 先手番専用定跡s-book_blackが優秀すぎた。私が2年前に開発したテラショック定跡生成手法では到底太刀打ちできなかった。そこでやねうら王プロジェクトでは、新たにスーパーテラショック定跡生成手法というのを考案し、やねうら王に実装したのであった。 前回記事 : 先手番専用定跡s-book_blackの厚い壁 https://yaneuraou.yaneu.com/2021/11/01/thick-walls-of-s-book_black/ テラショック定跡生成手法のおさらい まず簡単にテラショック定跡手法をおさらいし、何が悪かったのかを書き、今回それをどう改善したのかを書く。 テラショック定跡は与えた棋譜の各局面に対して長い時間をかけて思考させる。1局面につき探索1スレッド×1時間でやっていた。1スレッドにしているのは、将棋ソフトは並列化効率が悪いからで、スレッド

    BigHopeClasic
    BigHopeClasic 2021/11/05
    まだまだ定跡を巡る長い旅は続く
  • 渡辺明名人と東大教授で日本の脳研究の第一人者である池谷裕二先生との対談記事が間違いだらけである件 | やねうら王 公式サイト

    ここまでひどい記事は久しぶりだ。 渡辺明名人の疑問「将棋の初手でこれを指したら負けという“必敗”の手はありませんか?」 脳研究者の答えは… https://number.bunshun.jp/articles/-/846635 この手の対談は、編集側が元の発言とは異なる意図で解釈して、誤った書き方にしてしまうことが多々あるので、誰が悪いのかということはここでは問題としないことにする。ただ、内容が間違いだらけではあるので、ここではそれを指摘するに留める。 14年前のAIは「奨励会1級とか初段ぐらいだった」 池谷 渡辺さんのすごいところは、転換期を迎えた時に「じゃあAIに学んでみるのも面白いかもしれない」と思ったことですね。柔軟な適応力で発想の着火点をスムーズに転換されています。渡辺さんはかなり早い時期からAIと対戦されていましたよね? 渡辺 あれは2007年ぐらいでしたが、まだAIが全然強く

    BigHopeClasic
    BigHopeClasic 2021/01/14
    正直本誌にあれが載らなかったのは不幸中の幸い。数学者の篠田アマ竜王にも反論を執筆してほしい。
  • ふかうら王(dlshogi互換エンジン) Technology Preview #1 | やねうら王 公式サイト

    dlshogi互換エンジン「ふかうら王」を公開しました。 ふかうら王(dlshogi互換エンジン) Technology Preview #1 https://github.com/yaneurao/YaneuraOu/commit/8dc5e58c7490220edd74541045a0499ff7871c4d dlshogiはAperyの指し手生成や盤面操作のためのフレームワークとして使用している。今回、Aperyに依存する部分をすべてやねうら王に依存するように書き換えた。Aperyとやねうら王の細かい違いがあるため、これは簡単な作業ではなかったが、とりあえず、ある程度のところまでやねうら王に移植してくることができた。ついでにdlshogiにあった潜在的なバグもかなり修正した。 - dlshogi互換エンジン - dlshogiの詰将棋ルーチンをオフにして、1スレッドで5万ノードを探索

    BigHopeClasic
    BigHopeClasic 2020/12/22
    ディープラーニングなやねうら王とはいえ、深浦康市がいなかったらこのネーミングには絶対になってないよね
  • 新感覚の将棋ソフト『たけわらべ』を期間限定で公開します | やねうら王 公式サイト

    竹部さゆり女流プロデュースの新感覚の将棋ソフト『たけわらべ』を期間限定で公開します。 なんと!評価関数ファイルはありません。 体だけ将棋所かShogiGUIに登録すればすぐに遊べます。 (エンジンオプション等は、やねうら王と同じです。) 現代の最新の将棋ソフトには到底敵いませんが、人間相手だとわりと強いです。 ・KPPT型のように形に対する評価を一切持っていない。 ・利きがすべて。利きだけで盤面を制圧する将棋。 ・見たことのない囲いが頻出する。人間は初見で対応するのは難しい。 ・囲いに対する知識は一切持っていない。 次の画面の後手が「たけわらべ」です。 何この囲い…何この攻め…何これ。こんな将棋負けるのか…なんだこれ。将棋って何…。 みたいなやられ方をします🤮 次の画面も後手が「たけわらべ」です。囲いも攻めも独創的すぎて笑えます。 田舎将棋の強いおっさん(定跡書も何も読んだことがない

    BigHopeClasic
    BigHopeClasic 2020/11/19
    利きしか見ていないのにアマ高段レベルという/利きしかみていなくても、今のやねうら王の探索が極めて優秀なので、読みが鋭いと危険を回避するからな
  • dlshogi強すぎクソワロタ | やねうら王 公式サイト

    AlphaZeroの再現実験として、YSSの山下さん、Bonanzaの保木さん、Ray(囲碁ソフト)の小林祐樹さんのゴールデンコンビがタッグを組んだAobaZeroというソフトがあるのですが、ここ最近は棋力が停滞気味であります。 http://www.yss-aya.com/aobazero/ 対して、AlphaZeroのようにDeep Learningを用いている将棋ソフトではあるものの、山岡忠夫さんのdlshogiのほうは、AlphaZeroの再現にはこだわってないようで、C++で高速化したり、終盤用にdf-pnによる詰将棋ルーチンを搭載したり、LeelaChessZero(AlphaZero型のオープンソースのChessのソフト)の改良点を取り込んだり、TensorRTを用いた高速化を行うなど、様々な改良を意欲的にされていて、ずいぶん強くなっているようです。 将棋AIの進捗 その42

    BigHopeClasic
    BigHopeClasic 2020/04/22
    ちなみに2080tiを使うと、2年前の最強ソフトにレート50くらい届かない感じです<dlshogi チェスを見るとNN使用ソフトは通常のソフトと読みが異なることも多く、多少弱くても通常の将棋ソフトでの研究補完には有用かと
  • WCSC29、やねうら王優勝しました! | やねうら王 公式サイト

    第29回世界コンピュータ将棋選手権(WCSC29)で、『やねうら王 with お多福ラボ2019』は優勝しました。応援してくださった皆様、ありがとうございます。 手短にいくつか印象に残った試合と簡単な感想を書いておきます。 Qhapaq戦 Qhapaqはこちらが指し手を思考している最中に相手の指し手を別のPCで予測して、それに対するponderの指し手を探索する『Pre-ponder』という隠し球を実装しているそうでした。 QDMのクラスタはmultiponderベースだったのですが独自実装のpreponderを加えることで相手の持ち時間の120%を使えるという謎の効率化に成功しました。 — Ryoto_Sawada☀Qhapaq (@Qhapaq_49) May 5, 2019 そこで、Qhapaq戦については、SlowMover(序盤重視率)=67にして、序盤の思考時間を減らして終盤に

    BigHopeClasic
    BigHopeClasic 2019/05/06
    id:smeg 全然別の技術導入でできないことはないけど現状無理っすよそれ。既存技術はそういう判断はできない。
  • 最新の将棋ソフトが2手目34歩を悪手だと言い始めた件 | やねうら王 公式サイト

    近年の将棋ソフトは2倍の思考時間を使えばR200程度強くなる。ということは、家庭用PCで15分切れ負けの対局でR4300程度だと言われている最新ソフトを自己対局させるとして、片方のソフトだけ持ち時間をその倍である30分を与えるとどうなるだろう? そのソフトは、見かけ上、R4300 + R200 = R4500ぐらいの強さを発揮するわけであるな。 では、もっと桁違いの時間を与えるとどうだろう? 15分切れ負けのとき、序盤の1手には10秒ぐらいしか使わないが、その序盤の特定の局面に対して、1,000倍の時間(10,000秒)を与えれば、そのときの棋力はどれだけになるだろう? log(2)1024 = 10なので、10×R200 = +R2000ぐらい強くなり、R4300 + R2000 = R6300のソフト相当になるのではなかろうか。 R6300のインパクトが強すぎてどれくらいの強さなのか想

    BigHopeClasic
    BigHopeClasic 2019/04/16
    これも今の所アルファゼロが「先手後手とも相掛かりがベストじゃね?」と言っているだけなので、さらにソフトが進化することで評価は全然変わる余地がある。特に振り飛車の再評価。
  • フロッピーディスクに収まる評価関数バイナリ公開しました | やねうら王 公式サイト

    NNUE評価関数は、ネットワーク構成を簡単にカスタマイズできるようになっている。 そこで、入力をK(玉のいる升)とP(どの升にどの駒がいるかに対応する値)だけにして(81升 + 1629通り = 1710)、hidden層の1層目を256×2、2層目・3層目を32にして学習させた。(K-P-256-32-32) NNUEを知らない人のために書くと、各層は全結合。 ※ 補足 : ニューラルネットの入力は、駒が存在するところを1、存在しないところを0とした1710次元のベクトル。 教師はdepth 8で生成した10億局面から学習させてみたところ、elmo – R30程度になった。 ファイルサイズは873KB。(zipで圧縮して400KB程度) 教師をもう少し深いdepthで生成すれば、まだ強くなるはず。 とりあえず公開しておいた。 https://github.com/yaneurao/Yan

    BigHopeClasic
    BigHopeClasic 2019/01/16
    三駒関係の評価関数はそろそろ限界、四駒関係はサイズが大きすぎてRAMに乗らない、というタイミングで、これほど発展性に余裕のある評価関数の形式が出てきたその絶妙さを思う。
  • コンピュータ将棋プログラマが白旗を上げ始めたようです。 | やねうら王 公式サイト

    コンピュータ囲碁の世界では、長きに亘り良い評価関数を設計できずに苦心していました。評価関数というのは、人間で言うと大局観に当たる部分です。この部分をうまく設計するのが強い囲碁ソフトを作る上で必要不可欠なのですが、それは職人のような作業だと言われていました。 そのあとAlphaZeroが現れたことにより、評価関数は人間が設計したものより、ニューラルネットワーク(以下NNと記す)のほうがうまく表現できることが証明されました。このことは、コンピュータ囲碁プログラマの敗北であると同時に新たな時代の幕開けでした。 一方、コンピュータ将棋の世界は少し様相が異なりました。コンピュータ将棋では、2005年にBonanza6が取り入れた、王様とそれ以外の任意2駒といういわゆる三駒関係(KPP)を10年以上使ってきました。途中でNDF[2014]が手番を入れてKPPT(Tは手番ではなくTurnのT)型に進化し

    BigHopeClasic
    BigHopeClasic 2018/12/27
    今の勢いだとLeelaChess0がStockfishを抜くのは時間の問題。来年の世界コンピュータ将棋選手権でニューラルネットワークエンジン勢が決勝日に進出できるかは見どころ(DeepMindが出るとは全く思ってない)。
  • 人間の棋譜を用いずに評価関数の学習に成功 | やねうら王 公式サイト

    今回、新たに評価関数をゼロベクトルから学習させた。elmo絞りを使うと意外と簡単にApery(WCSC26)相当の棋力を持つ評価関数にまで出来るようだ。追試できるように記事の前半に手順を記しておく。また、記事の後半には何回目のelmo絞りでどの程度の強さであったかも示す。 elmo絞りを知らない人のために簡単に説明すると、今回、将棋ソフトが人間の棋譜を用いずに勝率の高い形を強化学習でソフト自らが自動的に覚えたということである。今回、1回に生成している教師の数は5億局面。対局回数で言うと400万局程度であろうか。それだけの対局を終局までこなすことで、どういう駒の位置関係だと勝ちやすいのかを学習したということだ。 私は以前、elmo絞りを用いずにある程度の強さまでは到達出来たのだが、計算資源を湯水の如く消費するので途中で断念してしまった。今回はそのリベンジである。題して「Re : ゼロから始め

    BigHopeClasic
    BigHopeClasic 2017/06/12
    “一言で言うとelmo式の効果が凄すぎた。プロの棋譜を使わない評価関数の栄誉はelmoの作者である瀧澤さんに捧げられるべきである。”Bonanza以来の12年を全て塗り替えた滝澤誠マジやべぇ、というお話。
  • WCSC27はelmoが優勝 | やねうら王 公式サイト

    WCSC(世界コンピュータ将棋選手権)決勝日は、elmoの全勝優勝で幕を閉じた。今後数年は無敗を誇るのではないかと言われたPonanza Chainerに予選2日目、決勝日の2回当たり、どちらもelmoが勝利。 その思考エンジンには、やねうら王が(ほぼそのまま)使われているらしく、elmoの評価関数についてはすでに公開されている。導入手順などは次の記事を参考にして欲しい。 やねうら王 セットアップ質問スレッド WCSC27最終日、elmo全勝優勝おめでとうございます!! やねうら王の思考エンジンの優秀性が証明されたようで嬉しいです。 私「elmo(の思考エンジン)は、ワシが育てた。」 — やねうら王 (@yaneuraou) May 5, 2017 とりあえず、私もドヤ顔で上のツイートしといたけども、実際のところ、やねうら王はAperyや魔女、Stockfishなど多くのオープンソースのソ

    BigHopeClasic
    BigHopeClasic 2017/05/05
    ここに書かれている通り、数多くの人々のオープンな知が、徹底的にクローズなponanzaを刺した、というのが、胸が熱くなるんだ。
  • 電王戦Finalを終えて その2 | やねうら王 公式サイト

    昨日の予告通り、色々書いていきたいと思います。今日の記事は記者会見前に他の開発者と話したこと。 平岡さんに「やねさんは、ほんま賢い」と褒められまくった件 やね「平岡さん、何べてるんすか?」 平岡「(スポンサー提供の)バームクーヘンとプリン…」 やね「このあと打ち上げですよ?」 平岡「べたかってんもん…」 やね「打ち上げはドワンゴの金でべ放題ですよ?」 平岡「!!?」 やね「バームクーヘンとプリンなら鞄に入れて持ち帰ればいいじゃないですか。」 平岡「ほんまや!(゚д゚)」 やね「私はバームクーヘン2個、鞄に詰めましたよ?」 平岡「!!?」 このあと平岡さんが色んな人にこの件で「やねさんは、ほんま賢い!」と触れて回っていた模様。 そんなところ褒められても全然嬉しくないんですけど…。(笑) 西海枝さんはそこまで将棋が弱くない件 やね「(平岡さんのツイッター見たら)えらく早くに会場に着いたん

    BigHopeClasic
    BigHopeClasic 2015/04/13
    初段の免状くらいなら、全然取っておいていいのに。
  • 電王戦第二局における検討用やねうら王の不可解な指し手について | やねうら王 公式サイト

    Seleneが反則負けをした局面で、検討用のやねうら王が2歩となる指し手を示しているらしく、「第三局のやねうら王は大丈夫なのか?」と心配する声を頂戴しております。 これについてはMIROさん(ニコファーレの中の人)が次のようにコメントしています。 やねうら王の読み筋画面に二歩の手がでたのはやねうら王の問題ではなく、棋譜データとしてそういう手が流れてしまったから。ではなぜその手がデータとして流れたのか、は今回のSeleneの問題に起因するもので理由がわかると実はちょっと面白いです http://t.co/Hr1MKCGZQX — MIRO (@MobileHackerz) March 22, 2015 ところで、何故第二局の検討用のソフト(評価値と読み筋を提供するソフト)がやねうら王なのでしょうか? 気づいている人は気づいていると思いますが、前回電王戦出場の第1局から第5局のソフトが、今回の

  • 鈴木八段のせいで平岡さんに批判が集まっているようです? | やねうら王 公式サイト

    将棋電王戦FINAL 第1局 斎藤慎太郎五段 vs Apery」において、Aperyの開発者の平岡さんが投了せずにAperyが最後まで指したことにより、一部の将棋ファンから批判が集まっているようです。鈴木八段がその行為に対して実況において否定的な言い方をしたため、一部の将棋ファンがなびいてしまったのかも知れません。 ※ 記事は鈴木八段の発言内容を非難する意図はありません。 特にひどい発言の例をここで挙げようかと思っていたのですが、なんかそのtwitterアカウントは釣りくさいので注目を浴びるのは却って彼を喜ばせてしまうことになるので、ここで挙げるのはやめておきます。 まあ、そういう発言は、民度の低い一部の将棋ファンだけのものであって、ほとんどの将棋ファンはそういうことはありません。そのことは次のまとめを見てもわかります。 「将棋電王戦FINAL 第1局 斎藤慎太郎五段 vs Apery

  • 将棋の探索空間の広さについて | やねうら王 公式サイト

    将棋の探索空間はどれくらいの広さなのでしょうか。 チェスの場合、1手から最終局面までの手順数(探索空間)は10の120乗程度と言われている。将棋の場合は、10の220乗。一度取った相手の駒を使うことができるため、とたんに増えてしまう。囲碁は盤面の広さもあって10の360乗である。 将棋対決・第1回  チェスコンピュータからの応用でもアマ20級 上の記事に見られるような「10の220乗」というのが定説になっています。 ところが、一定以上の棋力を持つプレイヤーに限定する場合、桁違いに狭いというのが私の考えです。10の220乗どころか、10の50乗すらいかないと私は思っています。 やねうら王では探索をしない場合、プロの棋譜との指し手一致率は、以下のようになっています。 Prediction(%) = 43.5828, 64.8331, 75.9408, 82.7774, 87.3075, 90.

    BigHopeClasic
    BigHopeClasic 2014/12/18
    問題はいかにゴミ手を切り落とすかであって、完全解析をうたう以上はそこはクリアできないんじゃないのかなあと。
  • 1