概要 アニメ監督またはアニメ制作会社とアニメ作品,出演声優には何らかのトピック(作品ジャンル)の関係が存在するという仮定に基づきAuthor-Topic Modelを適用する. アルゴリズム Probabilistic Author-Topic Models for Information Discovery(KDD 2004)(pdf) LDAでは文書 - 単語の関係だったけど,Author-Topic Modelでは文書の上に著者を考える.で,著者がトピックを選び,そのトピックに従って単語が選ばれるとする. データ しょぼいカレンダーをクロールし,2005年以降のアニメ,アニメ映画,OVAで試した. アニメ監督,アニメ制作会社,声優はそれぞれ「、」で繋げて書かれている事があるのでセパレータとした. クローラの実装はこれ(GitHub - ybenjo/crawl_syobocal: c