タグ

ブックマーク / qiita.com/hsoccer (1)

  • gensimによるword2vecの利用例 - Qiita

    はじめに 最近、単語の分散表現を学び、使ったので、その際に得た知識をまとめておく。 この記事では、MeCab、gensimを用いて、夏目漱石の『こころ』に登場する単語の類似度を計算する。 GitHubにこの記事で使用する全てのコードをアップしてある。 https://github.com/hsoccer/my_word2vec 環境 OS X El Capitan Python3系 MeCabのインストール 以下のページ等を参考にインストールする。 追加の辞書であるmecab-ipadic-neologdもインストールしておく。 https://qiita.com/taroc/items/b9afd914432da08dafc8 MeCabの辞書を強化する デフォルトの辞書では弱いので、Wikipediaの見出語を全て辞書に加えておく。 user.dicという名前で保存しておく。 以下のペ

    gensimによるword2vecの利用例 - Qiita
  • 1