論文: Emergent Tool Use from Multi-Agent Interaction 昨年 2019/09/17にOprnAIが出したかくれんぼ(hide and seek)強化学習論文を読んだので、備忘がてらブログにメモ。 メモなので、正確に書いていないことだけはご了承ください。。。 タイトルは"Emergent Tool Use from Multi-Agent Interaction" という論文。 かわいいagent君達がかくれんぼを学習していく様子からは想像つかないタイトルですね(小並) arxiv.org openai.com www.youtube.com また、「そもそも強化学習とは?」といった基礎的な話題は割愛させていただくことをご了承ください。。。 (余談) 白金鉱業fmのコンンツのために読んだ 白金鉱業fm という有志メンバーでのpodcastを定期的