エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Doc2vec, K-meansを用いた文書クラスタリング - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Doc2vec, K-meansを用いた文書クラスタリング - Qiita
流行りのDoc2vecを使って文書クラスタリング みなさん、元気に自然言語処理〜!? 流行りのWord2vecの文... 流行りのDoc2vecを使って文書クラスタリング みなさん、元気に自然言語処理〜!? 流行りのWord2vecの文書版、Doc2vecでクラスタリングしてみました。ベクトルさえあればクラスタリングは簡単にできます。 なんらかの方法でベクトル、またはベクトルをつくってくれるモデルを取得しましょう。 Doc2vecを行う際はここを参考にすると良いと思います。モデルが簡単に手に入ります。 #coding: UTF-8 from gensim.models.doc2vec import Doc2Vec from gensim.models.doc2vec import TaggedDocument import sys f = open(sys.argv[1],'r')#空白で単語を区切り、改行で文書を区切っているテキストデータ #1文書ずつ、単語に分割してリストに入れていく[([単語1,単語2,