6月に80000件ぐらい作品収集したのですが、あれは全体平均しか見てないので、どんな内容だと良いのかまでは良くは分かりません。 データは6月と同じですが、より、詳細に内容を検討するために ジャンルごとに分割して因子分析します。 歌詞とほとんど同じ方法ですが、 各作品のあらすじをbag-of-word形式の単語ベクトルに変換して、 主因子法でバリマックス回転 因子数は、適宜変えます。 因子数が少なくて済むジャンルと、全然足りないジャンルがあるからです。 得られた因子の内、統計的に有意な因子を見ていきます。 ところで どういうわけかジャンル 恋愛、歴史 は 特に女性向けです。 作者も、読者も女性です。 そんな傾向みんな知ってますかね?
[This article was first published on R by R(yo), and kindly contributed to R-bloggers]. (You can report issue about the content on this page here) Want to share your content on R-bloggers? click here if you have a blog, or here if you don't. As the monsoon rains fall, another TokyoR User Meetup! On June 29th, useRs from all over Tokyo flocked to Hanzomon, Tokyo for another jam-packed session of #r
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く