タグ

ブックマーク / yaneuraou.yaneu.com (3)

  • AlphaZero Shogi弱すぎクソワロタ | やねうら王 公式サイト

    AlphaZeroのShogi版は、あっという間に従来の将棋ソフトを抜き去ったかのように喧伝されているので今回はここで少しばかり反論したい。 AlphaZero(の手法)が、将棋のドメイン知識(ゲーム固有の知識)を用いずに、汎用性の高い方法でゼロから機械学習をして、囲碁・将棋・チェスのAIにおいて成功を収めた。ここに異論はないし、素晴らしい業績だと思う。この点は、惜しみなく称賛すべきであると思う。 しかし、従来の将棋ソフトを圧倒的に追い抜いたのかについては若干の疑念がある。今回は、それについてざっと書いておきたい。 AlphaZeroの論文では、aperypaqとも対局させたと書いてある。aperypaqは最新のやねうら王エンジンと組み合わせるとおそらくR4300相当である。AlphaZeroはそれよりR150か200ほど強いことになっている。正確な数値はよくわからないが、まあ仮にR200

  • コンピュータ将棋プログラマが白旗を上げ始めたようです。 | やねうら王 公式サイト

    コンピュータ囲碁の世界では、長きに亘り良い評価関数を設計できずに苦心していました。評価関数というのは、人間で言うと大局観に当たる部分です。この部分をうまく設計するのが強い囲碁ソフトを作る上で必要不可欠なのですが、それは職人のような作業だと言われていました。 そのあとAlphaZeroが現れたことにより、評価関数は人間が設計したものより、ニューラルネットワーク(以下NNと記す)のほうがうまく表現できることが証明されました。このことは、コンピュータ囲碁プログラマの敗北であると同時に新たな時代の幕開けでした。 一方、コンピュータ将棋の世界は少し様相が異なりました。コンピュータ将棋では、2005年にBonanza6が取り入れた、王様とそれ以外の任意2駒といういわゆる三駒関係(KPP)を10年以上使ってきました。途中でNDF[2014]が手番を入れてKPPT(Tは手番ではなくTurnのT)型に進化し

  • 評価関数をブリードすると何故強くなるのですか? | やねうら王 公式サイト

    評価関数を合成するのが流行っている。ここで言う合成とは、2つの評価関数のそれぞれのパラメーターを足して2で割ることである。ブレンドと呼ばれている。 1:1でブレンドする以外にも比率は自由に変更できる。また「ブレンド」という用語は、ダビスタになぞらえて「ブリード」とも呼ばれている。 しかしブリードすると何故強くなるのかについてはよくわからない。 将棋の評価関数、何故二つブレンドすると強くなるのかはよくわからないが、そういや機械学習とかで使う顔写真のデータセット、顔のパーツ(目・口・鼻)の位置を平均化すると結構イケメンになるんだけど、その原理とかは解明されてたりするのかな? — やねうら王 (@yaneuraou) July 13, 2017 顔のパーツの位置は両親のを遺伝的に引き継ぎ、(父+母)/2+ガウス分布であるとする。あまりに変な位置にパーツがあるとブサイクであり子孫を残せないのでいま

    isaisstillalive
    isaisstillalive 2017/07/20
    MAGIシステム
  • 1