収集したデータは、下記のようにcsv形式で保存しています。 キーワード”暴落” キーワード”買い占め” キーワード”安部首相” キーワード”花見” キーワード”緊急事態宣言” コーパスの作成 テキストマイニングを行うために、テキストを分かち書きします。このとき、文書において語の区切りに空白を挟んで記述する必要があります。これをjanomeで解析処理します。 データ加工/学習 pythonのGloVeのライブラリは、以下のリンク先を利用します。 https://github.com/hans/glove.py GloVeの学習で必要となる単語辞書、共起行列の作成を行います。作成したコーパス、単語辞書、共起行列を用いて、学習を行います。 ソースコード # coding: utf-8 from janome.tokenizer import Tokenizer from gensim.model
![pythonを用いたテキストマイニング ニュース記事解析 GloVe活用【プログラムあり】](https://cdn-ak-scissors.b.st-hatena.com/image/square/c95587c6ab41b7f2279a4eaf00510eebd1d8cb12/height=288;version=1;width=512/https%3A%2F%2Fsoftware-data-mining.com%2Fwp-content%2Fuploads%2F2019%2F05%2Fmatrix-2953869_1920-2.jpg)