タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

コンピュータと人工知能に関するtimetrainのブックマーク (1)

  • 今の将棋ソフトはAlphaZeroを超えている件 - コンピュータ将棋 Qhapaq

    AlphaZeroの論文は世界に衝撃をもたらしました。曰く、ディープラーニングと強化学習で作られた評価関数は激烈に強く、囲碁だけでなく、チェス・将棋でも人間を超え最強のソフトを超えたと。 人間 vs コンピュータに終止符を打ち最後まで絶対的強さを魅せつけたPonanza、そのPonanzaをWCSC27で破ったelmo、そのelmoを90-2-8で破ったAlphaZero。elmoとのレート差は約400。コンピュータ将棋も終わった。 ......と思ったかも知れません。あの時は。 しかし、AlphaZeroの論文(2017年12月発表)から1年も経たないうちその神話は終焉を迎えました。 レーティングサイト(新/旧)のレーティング表からもお察しの通り、今の将棋ソフトのレーティングはelmo+400ぐらいの値が出ています。 orqha0926はorqhaの最新バージョン(公開版orqhaに対し

    今の将棋ソフトはAlphaZeroを超えている件 - コンピュータ将棋 Qhapaq
    timetrain
    timetrain 2018/10/08
    教師あり学習と強化学習の違いであって、どっちもすごいと思う
  • 1