6月に80000件ぐらい作品収集したのですが、あれは全体平均しか見てないので、どんな内容だと良いのかまでは良くは分かりません。 データは6月と同じですが、より、詳細に内容を検討するために ジャンルごとに分割して因子分析します。 歌詞とほとんど同じ方法ですが、 各作品のあらすじをbag-of-word形式の単語ベクトルに変換して、 主因子法でバリマックス回転 因子数は、適宜変えます。 因子数が少なくて済むジャンルと、全然足りないジャンルがあるからです。 得られた因子の内、統計的に有意な因子を見ていきます。 ところで どういうわけかジャンル 恋愛、歴史 は 特に女性向けです。 作者も、読者も女性です。 そんな傾向みんな知ってますかね?