エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
テキスト分析は 原文検索がサクサクできないとね ~part2:Word2Vec編 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
テキスト分析は 原文検索がサクサクできないとね ~part2:Word2Vec編 - Qiita
はじめに 前回記事で GiNZAに「国語研長単位モデル」を適用し、分かち書きしたデータをキーワードに原文... はじめに 前回記事で GiNZAに「国語研長単位モデル」を適用し、分かち書きしたデータをキーワードに原文検索を実行しました。 原文検索においては、キーワードの前後に現れる「周辺語」、2つのキーワードに紐づく「関連語」がわかると、よりテキスト理解の助けになります。 今回の記事は、この「周辺語」「関連語」の検索をWord2Vecで実行した記事です。 実行したこと Google Colabで実行しています。 テキストデータは、Excel表形式にまとめられたアンケート等を想定し、csvデータとしています。適用データは 以前の記事 同様、tweetデータ(csv)です。(※「再エネ」でtweet検索したつぶやきを ついすぽ でcsvにエクスポートしたデータです。) 以下、以前の記事で実行した内容です。 読込んだcsvデータをデータフレームに格納し、GiNZAで行単位でテキスト処理した後、分かち書きの