ブックマーク / qhapaq.hatenablog.com (2)

  • 今の将棋ソフトはAlphaZeroを超えている件 - コンピュータ将棋 Qhapaq

    AlphaZeroの論文は世界に衝撃をもたらしました。曰く、ディープラーニングと強化学習で作られた評価関数は激烈に強く、囲碁だけでなく、チェス・将棋でも人間を超え最強のソフトを超えたと。 人間 vs コンピュータに終止符を打ち最後まで絶対的強さを魅せつけたPonanza、そのPonanzaをWCSC27で破ったelmo、そのelmoを90-2-8で破ったAlphaZero。elmoとのレート差は約400。コンピュータ将棋も終わった。 ......と思ったかも知れません。あの時は。 しかし、AlphaZeroの論文(2017年12月発表)から1年も経たないうちその神話は終焉を迎えました。 レーティングサイト(新/旧)のレーティング表からもお察しの通り、今の将棋ソフトのレーティングはelmo+400ぐらいの値が出ています。 orqha0926はorqhaの最新バージョン(公開版orqhaに対し

    今の将棋ソフトはAlphaZeroを超えている件 - コンピュータ将棋 Qhapaq
  • 最強ソフトの言うことの真逆をやると最弱になるのか検証してみた - コンピュータ将棋 Qhapaq

    今や将棋研究のお供の定番である将棋ソフトですが、その裏で初心者の練習相手としても定番になりつつあるようです。駒の動かし方を覚えた人が次にやるべきなのが数練習をすることであり、数をこなす為のモチベーションを維持する際に、無限に遊んでくれてしかも負けてくれる将棋ソフトにニーズがあるようです。 どのぐらいニーズがあるかというと、絶対王者のponanzaさえも弱いソフトを作ることに一石投じる程度にはニーズがあるようです。 将棋ウォーズにある史上最強に弱いPonanzaの話|山 一成@Ponanza|note 曰く、クッソ強いponanzaの評価値を反転すればクッソ弱いソフトが出来る。 成る程。ponanzaが全力で悪くなる局面を探してくれるなら、確かに弱くなりそうだ。しかし私はこの記事を見て「ソフト同士が負けることに全力を尽くした場合、果たしてどのくらいまで弱くなるのか」が気になりました。 ここ

    最強ソフトの言うことの真逆をやると最弱になるのか検証してみた - コンピュータ将棋 Qhapaq
    aoiyotsuba
    aoiyotsuba 2018/01/16
    こういう発想(最弱を作る)を思いつくのは人間ならではだと思う。
  • 1