Ponanzaにおける強化学習とA/Bテスト運用 山本一成氏(以下、山本):山本一成と申します。よろしくお願いします。 ありがとうございます。ここからはややガチめなエンジニアの話です。まず確認したいんですが、エンジニアとかプログラマーって人はどれくらいいるんですかね? (会場挙手) あ、けっこういるのか! 安心した(笑)。 私、10年くらい将棋のプログラムを作ってきて、最初はまったくのど素人から始めたんですけど、いろいろやっていく中で、現代にも通じるようなさまざまな運用とかが出てきたんですね。そのへんをみなさんと共有できればと思っています。 まず最初のスライド、さっそく手書きでやる気がない感じですが(笑)。将棋のプログラムってどんなもの? という話です。将棋も囲碁も、大雑把にいうと、2つの要素があります。1つは探索です。つまり、先を読むということですね。 先を読むと強いです。みなさんもそん
![Ponanza開発者、山本一成氏が語る強化学習とA/Bテスト運用の舞台裏](https://cdn-ak-scissors.b.st-hatena.com/image/square/e2bce9a5b4936a9fe93c22e51318d77ce480cff9/height=288;version=1;width=512/https%3A%2F%2Fimg.logmi.jp%2Farticle_covers%2FTr4exNrFQYTD5muYeTJBhw.jpg)