大局観がなくなるディープラーニングの学習方法に壁 ――Ponanzaのディープラーニングは今どの段階にあるのでしょう。 山本氏:最初にやったのは、教師ありディープラーニングです。Ponanzaは、古典機械学習の教師あり学習をやって、そのあとに教師なし学習をやっているですが、今はPonanzaどうしの棋譜を使って教師ありディープラーニングをやりました。そうしたら、次は教師なしディープラーニングかな、という話がありますよね。ただ、それはわかりません。AlphaGoはここをやっていますね。でもそれが正統進化なのかはわかりません。囲碁の場合はそういう進化をしていきました。 ――AlphaGoは段階的に使っていったんですか? 山本氏:論文的には、段階的にやっていったことになっています。ただ、現実的には紆余曲折を経たと思います。意外と苦労しているような感じなので、論文は実際のシナリオと違うことがあるの