タグ

ブックマーク / qiita.com/To_Murakami (1)

  • LDA(Latent Dirichlet Allocation)について - Qiita

    はじめに 「歌」「演奏」「ダンス」などの単語を見た時、書いていないくても「音楽」を想起できる。 →複数の単語の共起性から創発される情報 潜在的意味のカテゴリをトピックと呼ぶ。 試しに動かしてみた ジャンルの異なる任意のwikiの文章(カリフラワー、NASA、マスカラ)をインプットし、それぞれの文章のテーマを抽出、LDAで分類できているかを確認する 実行結果 なんとなくできてそう。それぞれの単語があるべきカテゴリに分けられている。 カリフラワー、NASA、マスカラでは記事内の単語の出現パターンが大分異なるため、モデルとしてもイージーだったかもしれません。 お試し実行コード 基コード... # LDA(Latent Dirichlet Allocation)のRパッケージを試してみるスクリプト # # 複数のテキストからトピックを抽出する # # 参考: # トピックモデルによる統計的潜在意

    LDA(Latent Dirichlet Allocation)について - Qiita
    Rion778
    Rion778 2017/08/01
    "char型にするとRMecabDFでエラーが出る"
  • 1