タグ

ブックマーク / obenkyolab.com (1)

  • 【Python】Doc2Vecで類似文書の表示 – Obenkyolab

    Python】Doc2Vecで類似文書の表示 by SEBONE · 公開済み 2021年3月28日 · 更新済み 2022年1月29日 概要自然言語処理分野において単語の分散表現を獲得する手法としてWord2Vecがありますが、その文章版、つまり文章を分散表現することができる手法としてDoc2Vecがあります。今回はPythonでDoc2Vecの使い方について勉強しました。 タスク設定文章群をDoc2Vecでベクトル化し、そのなかの一つの文章を選び、それと類似度の高い文書を文書群の中から選んで表示する。 使用する諸々Mecab 0.996gensimlivedoor NewsMeCabは以下で構築したものを使います。 Step1:データ取得今回は以下からlivedoor Newsコーパスをダウンロードして使用させて頂きました。ありがとうございます。 livedoor ニュースコーパス:

  • 1