AlphaZeroの論文は世界に衝撃をもたらしました。曰く、ディープラーニングと強化学習で作られた評価関数は激烈に強く、囲碁だけでなく、チェス・将棋でも人間を超え最強のソフトを超えたと。 人間 vs コンピュータに終止符を打ち最後まで絶対的強さを魅せつけたPonanza、そのPonanzaをWCSC27で破ったelmo、そのelmoを90-2-8で破ったAlphaZero。elmoとのレート差は約400。コンピュータ将棋も終わった。 ......と思ったかも知れません。あの時は。 しかし、AlphaZeroの論文(2017年12月発表)から1年も経たないうちその神話は終焉を迎えました。 レーティングサイト(新/旧)のレーティング表からもお察しの通り、今の将棋ソフトのレーティングはelmo+400ぐらいの値が出ています。 orqha0926はorqhaの最新バージョン(公開版orqhaに対し
![今の将棋ソフトはAlphaZeroを超えている件 - コンピュータ将棋 Qhapaq](https://cdn-ak-scissors.b.st-hatena.com/image/square/2c87f88ef8e87fb371738091bcbbcba8de9a0391/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fq%2Fqhapaq%2F20181006%2F20181006174130.jpg)