タグ

ブックマーク / yaneuraou.yaneu.com (5)

  • オセロの必勝法が見つかった件 | やねうら王 公式サイト

    すごいニュースが飛び込んできた。オセロの必勝法が見つかったのだ。正確に言うとオセロが弱解決された。まずはその論文を紹介する。 Othello is Solved : https://arxiv.org/abs/2310.19387 「弱解決(weakly solved)」を簡単に言うと、初期局面からの双方最善手を打つ時の結論(勝敗)がわかったと言う意味である。8×8のオセロの結論は引き分けなのだそうだ。「必勝法が見つかった」と記事のタイトルで書いたが、その結果として双方最善を尽くした時のオセロの結論が引き分けだったことが判明したので正しくは「必勝法(必ず勝てる方法)が存在しないことが証明された」とでも言うべきか。 今回は、初期局面から到達できるあらゆる局面についての結論(勝敗)がわかったわけではない。こちらは「強解決(strongly solved)」と呼ばれる。 弱解決と強解決とでは、

  • 新感覚の将棋ソフト『たけわらべ』を期間限定で公開します | やねうら王 公式サイト

    竹部さゆり女流プロデュースの新感覚の将棋ソフト『たけわらべ』を期間限定で公開します。 なんと!評価関数ファイルはありません。 体だけ将棋所かShogiGUIに登録すればすぐに遊べます。 (エンジンオプション等は、やねうら王と同じです。) 現代の最新の将棋ソフトには到底敵いませんが、人間相手だとわりと強いです。 ・KPPT型のように形に対する評価を一切持っていない。 ・利きがすべて。利きだけで盤面を制圧する将棋。 ・見たことのない囲いが頻出する。人間は初見で対応するのは難しい。 ・囲いに対する知識は一切持っていない。 次の画面の後手が「たけわらべ」です。 何この囲い…何この攻め…何これ。こんな将棋負けるのか…なんだこれ。将棋って何…。 みたいなやられ方をします🤮 次の画面も後手が「たけわらべ」です。囲いも攻めも独創的すぎて笑えます。 田舎将棋の強いおっさん(定跡書も何も読んだことがない

    timetrain
    timetrain 2020/11/19
    将棋は利きがあるかどうかが初心者段階ではめちゃくちゃ効くからなあ。面白そう。たぶんボコボコにされそうだ
  • WCSC29、やねうら王優勝しました! | やねうら王 公式サイト

    第29回世界コンピュータ将棋選手権(WCSC29)で、『やねうら王 with お多福ラボ2019』は優勝しました。応援してくださった皆様、ありがとうございます。 手短にいくつか印象に残った試合と簡単な感想を書いておきます。 Qhapaq戦 Qhapaqはこちらが指し手を思考している最中に相手の指し手を別のPCで予測して、それに対するponderの指し手を探索する『Pre-ponder』という隠し球を実装しているそうでした。 QDMのクラスタはmultiponderベースだったのですが独自実装のpreponderを加えることで相手の持ち時間の120%を使えるという謎の効率化に成功しました。 — Ryoto_Sawada☀Qhapaq (@Qhapaq_49) May 5, 2019 そこで、Qhapaq戦については、SlowMover(序盤重視率)=67にして、序盤の思考時間を減らして終盤に

    timetrain
    timetrain 2019/05/07
    人工知能をコマとして使った人間の勝負、という新しい次元を見た気がする。MUGENの勝負に近いといえば近いか。
  • フロッピーディスクに収まる評価関数バイナリ公開しました | やねうら王 公式サイト

    NNUE評価関数は、ネットワーク構成を簡単にカスタマイズできるようになっている。 そこで、入力をK(玉のいる升)とP(どの升にどの駒がいるかに対応する値)だけにして(81升 + 1629通り = 1710)、hidden層の1層目を256×2、2層目・3層目を32にして学習させた。(K-P-256-32-32) NNUEを知らない人のために書くと、各層は全結合。 ※ 補足 : ニューラルネットの入力は、駒が存在するところを1、存在しないところを0とした1710次元のベクトル。 教師はdepth 8で生成した10億局面から学習させてみたところ、elmo – R30程度になった。 ファイルサイズは873KB。(zipで圧縮して400KB程度) 教師をもう少し深いdepthで生成すれば、まだ強くなるはず。 とりあえず公開しておいた。 https://github.com/yaneurao/Yan

    timetrain
    timetrain 2019/01/16
    ニューラルネットワークもすごいけど、そこまで抽象化した人間もすごい
  • コンピュータ将棋プログラマが白旗を上げ始めたようです。 | やねうら王 公式サイト

    コンピュータ囲碁の世界では、長きに亘り良い評価関数を設計できずに苦心していました。評価関数というのは、人間で言うと大局観に当たる部分です。この部分をうまく設計するのが強い囲碁ソフトを作る上で必要不可欠なのですが、それは職人のような作業だと言われていました。 そのあとAlphaZeroが現れたことにより、評価関数は人間が設計したものより、ニューラルネットワーク(以下NNと記す)のほうがうまく表現できることが証明されました。このことは、コンピュータ囲碁プログラマの敗北であると同時に新たな時代の幕開けでした。 一方、コンピュータ将棋の世界は少し様相が異なりました。コンピュータ将棋では、2005年にBonanza6が取り入れた、王様とそれ以外の任意2駒といういわゆる三駒関係(KPP)を10年以上使ってきました。途中でNDF[2014]が手番を入れてKPPT(Tは手番ではなくTurnのT)型に進化し

  • 1