gensimのword2vecを使えるようにする † ネット上にあちこち記事がある。山内のメモは こんな感じ 似たような話として Python - Perl + Java = ? はてなブログのデータとパソコン工房のPCを使って「word2vec」で遊んでみた コーパスが圧倒的に強い。 ↑ 日本語wikipedediaのデータをコーパスとして学習させる。 † ウィキペディアの記事をコーパスとするために、形態素解析(MeCabなど)を 使って名詞だけ抜き出すことを試したが、結果があまり面白くないので、 他の人がやっているように →参照 分ち書きにするだけで済ませる。 ↑ word2vecのAPIを試す † gensimのword2vecモジュールの使い方は、チュートリアルとしては radimrehurekのページ に書いてあるが、使い方としては学習部分と、similarityとかだけである
![ノート/テキストマイニング/gensim-word2vecでベクトル空間を試す - 東邦大学理学部情報科学科 山内のサイト](https://cdn-ak-scissors.b.st-hatena.com/image/square/d1e9c50af5fb38a389caa6bf302a4a850952eed1/height=288;version=1;width=512/http%3A%2F%2Fpepper.is.sci.toho-u.ac.jp%2Findex.php%3Fplugin%3Dref%26page%3D%25A5%25CE%25A1%25BC%25A5%25C8%252F%25A5%25C6%25A5%25AD%25A5%25B9%25A5%25C8%25A5%25DE%25A5%25A4%25A5%25CB%25A5%25F3%25A5%25B0%252Fgensim-word2vec%25A4%25C7%25A5%25D9%25A5%25AF%25A5%25C8%25A5%25EB%25B6%25F5%25B4%25D6%25A4%25F2%25BB%25EE%25A4%25B9%26src%3Dtest-capitals.png)