タグ

ブックマーク / blog.livedoor.jp/tak_tak0 (2)

  • 小説家になろうで人気になる因子分析 : 研究開発

    6月に80000件ぐらい作品収集したのですが、あれは全体平均しか見てないので、どんな内容だと良いのかまでは良くは分かりません。 データは6月と同じですが、より、詳細に内容を検討するために ジャンルごとに分割して因子分析します。 歌詞とほとんど同じ方法ですが、 各作品のあらすじをbag-of-word形式の単語ベクトルに変換して、 主因子法でバリマックス回転 因子数は、適宜変えます。 因子数が少なくて済むジャンルと、全然足りないジャンルがあるからです。 得られた因子の内、統計的に有意な因子を見ていきます。 ところで どういうわけかジャンル 恋愛歴史 は 特に女性向けです。 作者も、読者も女性です。 そんな傾向みんな知ってますかね?

    小説家になろうで人気になる因子分析 : 研究開発
    rishida
    rishida 2014/12/11
    一緒に趣味で研究したい
  • word2vec内部技術の勉強 : 研究開発

    総合研究大学院大学 複合科学研究科  情報学専攻 卒 博士(情報学) 自然言語処理や機械学習データ分析に関する研究内容とwebシステムの開発と運用について書いています。 シリコンバレーベンチャーみたいに深い技術の事業化をしたいと思っています。 ご興味ある方はご連絡ください。 word2vecの勉強しないといけないと思ったので、 Efficient Estimation of Word Representations in Vector Space. Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean. Google Inc. In Proceedings of Workshop at ICLR, 2013. We propose two novel model architectures for computing contin

    word2vec内部技術の勉強 : 研究開発
    rishida
    rishida 2014/10/16
    word2vecのポイントは、単語を連続値のベクトルで表現することらしい
  • 1