今回の目標 このシリーズでは教科書(文献1)に沿ってPythonによるスクレイピングと機械学習を学びます。今回は第6章「テキスト解析とチャットボットの作成」から6-2「Word2Vecで文章をベクトル変換しよう」を学びます。 このシリーズの学習では、原則教科書のサンプルプログラムを作成してゆきますが、著作権に配慮し、できるだけそのままではなく類題を作成して勉強してゆく方針です。 教科書で勉強することの整理 この節ではWord2Vecを用いて様々な文章に出てくる単語の解析を行う手法が解説されています。Word2Vecの実装としてはGensimを用いています。教科書のサンプルプログラムでは word2vec-kokoro.pyで「こころ」の文章をWord2Vecモデル化して保存 対話環境で「こころ」のモデルに出てくる単語の類義語を抽出 青空文庫から夏目漱石、芥川龍之介、太宰治の作品を一括ダウン