OpenAI、エージェントが相互に協力し合い、競争することを可能にする新しい強化学習アルゴリズム「MADDPG」を開発 2017-06-09 イーロン・マスク(Elon Musk)氏などが設立した人工知能を研究する非営利団体「OpenAI」は、エージェントが相互に協力し合い、競争することを可能にするマルチエージェント環境における新しい強化学習アルゴリズム「MADDPG」を開発しました。 前提知識として、ここでいうエージェントとは、なんらかの情報をインプットしてアウトプットする一連の概念のことを言います。そのエージェントのアウトプットに対してご褒美(報酬)の強弱でどれくらい良い行動だったか悪い行動だったかを学習させ最大化を目指すことを強化学習と言います。 今回、そんなエージェント同士が協力し合い、競い合うことを可能にする強化学習アルゴリズムを発表、このことで最大化という意味でより効果的な結果