#目標 教師なしデータを使い、word2vecを学習させ、それをEmbedding層としてテキスト分類問題に応用する。 #知識 word2vec 単語をベクトル化する。今回はpythonライブラリであるgensimを使用して、実装する。このライブラリは以下の論文を参考にしている。 ・Efficient Estimation of Word Representations in Vector Space ・Distributed Representations of Words and Phrases and their Compositionality ##転移学習 転移学習とは学習済みのモデルを利用して、新たなモデルを構築する手法である。 今回の場合でいうと、次のようである。 学習済みのモデル→gensimのword2vecモデル 新たなモデル→文書分類モデル 転移学習を利用した文書分類
