Bag of Wordsについて書いてみます。 ほとんどの機械学習は入力として数値データを与えなければなりません。そのため、自然言語処理において自然言語で書かれたデータを何らかの形で数値に変換する必要があります。Bag of Wordsはそのための一つの方法になります。 Bag of Wordsって何? 1. 数値変換 2. one hot vector 3. 足し合わせる pythonでの実装 gensimで実装 scikit-learnを使った実装 あわせて読みたい ゼロから作るDeepLearning おわり Bag of Wordsって何? Bag of Wordsというのは自然言語処理において自然言語(人間が日常で使用している言語)で記述されたデータ、つまり文をベクトルで表現する方法のことです。 Bag of Wordsは次の3ステップで作ることができます。 数値変換 one h
![Bag of Wordsについて書いてみる - どん底から這い上がるまでの記録](https://cdn-ak-scissors.b.st-hatena.com/image/square/06a15c64ba0ceec233d86d71001ebb29a9dcbf5d/height=288;version=1;width=512/https%3A%2F%2Fcdn.blog.st-hatena.com%2Fimages%2Ftheme%2Fog-image-1500.png)