イントロダクション みなさま、こんにちは(or こんばんは)。 次世代システム研究室のY.Tです。 最近は、急に夏から秋にシフトチェンジして温度変化がダイナミックになっていますが、みなさまはお体に気をつけてお過ごしでしょうか? 私の方は、温かいお風呂とビタミンCのこまめな摂取でなんとか季節の境目を乗り切ろうと奮闘中です。 さて今回は、「敵対的逆強化学習」をテーマとした内容をお届けします。 このブログをご覧になる皆様であれば、「強化学習」というキーワードをすでにご存知かもしれません。 今回取り上げるのは、逆強化学習のアルゴリズムの一つで、達人の手本を見様見真似で模倣するというものです。 どのあたりが「強化学習」の逆なのか、「敵対的」とはどういう忌みなのか、順を追ってご説明したいと思います。 世界チャンピオンを越えるAIを作り上げた強化学習。だが・・・ みなさんは「Alpha碁」というAIをご