エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【Python】Doc2Vecで類似文書の表示 – IT Learning
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【Python】Doc2Vecで類似文書の表示 – IT Learning
概要自然言語処理分野において単語の分散表現を獲得する手法としてWord2Vecがありますが、その文章版、... 概要自然言語処理分野において単語の分散表現を獲得する手法としてWord2Vecがありますが、その文章版、つまり文章を分散表現することができる手法としてDoc2Vecがあります。今回はPythonでDoc2Vecの使い方について勉強しました。 タスク設定文章群をDoc2Vecでベクトル化し、そのなかの一つの文章を選び、それと類似度の高い文書を文書群の中から選んで表示する。 使用する諸々Mecab 0.996gensimlivedoor NewsMeCabは以下で構築したものを使います。 Step1:データ取得今回は以下からlivedoor Newsコーパスをダウンロードして使用させて頂きました。ありがとうございます。 livedoor ニュースコーパス:https://www.rondhuit.com/download.html#ldcc ldcc-20140209.tar.gzをサイトから