タグ

2020年11月6日のブックマーク (2件)

  • バンディットアルゴリズムを用いた推薦システムの構成について - ZOZO TECH BLOG

    はじめに ZOZO研究所ディレクターの松谷です。 ZOZO研究所では、イェール大学の成田悠輔氏、東京工業大学の齋藤優太氏らとの共同プロジェクトとして機械学習に基づいて作られた意思決定の性能をオフライン評価するためのOff-Policy Evaluation(OPE)に関する共同研究とバンディットアルゴリズムの社会実装に取り組んでいます(共同研究に関するプレスリリース)。また取り組みの一環としてOPEの研究に適した大規模データセット(Open Bandit Dataset)とOSS(Open Bandit Pipeline)を公開しています。これらのオープンリソースの詳細は、こちらのブログ記事にまとめています。 techblog.zozo.com 記事では、ZOZO研究所で社会実装を行ったバンディットアルゴリズムを活用した推薦システムの構成について解説します。バンディットアルゴリズムを用い

    バンディットアルゴリズムを用いた推薦システムの構成について - ZOZO TECH BLOG
    chimerast
    chimerast 2020/11/06
    数年前、多腕バンディットを導入したら、クリエイティブ作る人が、ユーザに刺さるクリエイティブとは何かを学習してしまい、多腕バンディットをする意味なくなったと言ってたけど、ZOZOの規模だとまた違うんだろうか
  • ファンタジー世界が舞台のゲームでAIが「目的があるかのように」話したり行動したりできるようにする研究

    RPGなどのゲームをプレイしている最中に、村人のようなノンプレイヤーキャラクターが同じことしか言わなかったり、同じ行動ばかり続けていることにがっかりしたことがあるゲーマーは多いはず。ジョージア工科大学と、Facebook AI Research(FAIR)が協力して行った最近の研究で、「目標を持って会話したり行動したりするファンタジーゲームAI」が発表されました。 How to Motivate Your Dragon: Teaching Goal-Driven Agents to Speak and Act in Fantasy Worlds (PDFファイル)https://arxiv.org/pdf/2010.00685.pdf Teaching AI agents to communicate and act in fantasy worlds https://techxplor

    ファンタジー世界が舞台のゲームでAIが「目的があるかのように」話したり行動したりできるようにする研究
    chimerast
    chimerast 2020/11/06
    MMORPGのマルチエージェント学習面白そう。夢がある。寄り道してくれるようなAIも将来的にできるようになるのかな。そういうのは目標設定が難しそう。