前回はBag-of-Wordsを使って文章を英語かスペイン語か分類しました。 PyTorch DL for NLP -bag of wordsで英語とスペイン語を分類- Bag-of-Wordsは文書の特徴量でしたが、もっと細かく単語を特徴量として扱うにはどうすれば良いでしょうか。 今回は公式の以下のチュートリアルを参考に単語の特徴量について触れます。適宜スキップ、構成変更、意訳しているので、詳しく読みたい方は原文を参照してください。 コードは基本的に以下の公式のものを引用しています。 Word Embeddings: Encoding Lexical Semantics – PyTorch Tutorials 0.4.0 documentation 環境 MacBook Pro (Retina, 15-inch, Mid 2015) macOS High Sierra 10.13.5 P