Distributed Representations of Sentences and Documentsの概要 Motivation テキスト系の一般的な特徴量であるBoW形式では不十分な部分を克服したい 不十分な部分とは具体的には(1)語の順序が失われること、(2)語の意味が無視されること、(3)特徴量のベクトル長が固定されてしまうこと 教師なし学習によって、長さの異なる文章の可変長特徴ベクトルをパラメタ調整なしに作成 Contribution paragraph vectorとword vectorsを組み合わせることによってMotivationで示したBoWの3つの弱点を克服した Algorithms Learning Vector Represintation of Words 各単語の代表ベクトルを学習(Word2Vec) Paragraph Vector: A distri