タグ

トピックモデルとNLPに関するskozawaのブックマーク (3)

  • トピックモデルの評価指標 Coherence 研究まとめ #トピ本

    2013年8月10~11日にかけて北大函館キャンパス内で行われた統計勉強会の投影資料です。 2日目 2-4.devianceと尤度比検定 正規分布以外の確率分布では残差の考え方が変わってきます。そこでdevianceという概念を導入したうえで、GLMにおいて分散分析を実行する方法を解説します。 サイト作ってます http://logics-of-blue.com/

    トピックモデルの評価指標 Coherence 研究まとめ #トピ本
  • トピックモデルの評価指標 Coherence に関する論文まとめ - ほくそ笑む

    LDA などのトピックモデルの評価指標として、Perplexity と Coherence の 2 つが広く使われています。 Perplexity はモデルの予測性能を測るための指標であり、Coherence は抽出されたトピックの品質を評価するための指標です。 トピックモデルは確率モデルであるため、Perplexity の定義は明確です。 一方、Coherence は「トピックが人間にとって分かりやすいかどうか」を評価する必要があるため、その算出方法について様々な議論があります。 記事では、Coherence に関する研究の中で、主要な流れを作っている、特に重要な 5 つの論文をピックアップして紹介したいと思います。 Coherence とは Coherence は、「トピックが人間にとって分かりやすいか」を表す指標です。 例えば、トピックが { farmers, farm, food

    トピックモデルの評価指標 Coherence に関する論文まとめ - ほくそ笑む
  • トピックモデルを利用したアプリケーションの作成 | Tech-Sketch

    最近、「機械学習」や「自然言語処理」、といったキーワードを聞くことが多くなってきていると思います。 反面、すごそうだけどなんだか難しいもの、というイメージもあるのではないかと思います。そこで、今回は「自然言語処理」の一種であるトピックモデルを取り上げ、その仕組みを紹介するとともに、その実装方法について解説していきたいと思います。 (「機械学習」の方については、以前開催した勉強会の資料がありますので、興味があればそちらもご参照ください。) トピックモデルとは トピックモデルは、確率モデルの一種になります。つまり、何かが「出現する確率」を推定しているわけです。 トピックモデルが推定しているのは、文章中の「単語が出現する確率」になります。これをうまく推定することができれば、似たような単語が出てくる文章(=似たようなモデルの文書)が把握でき、ニュース記事などのカテゴリ分類を行ったりすることができま

    トピックモデルを利用したアプリケーションの作成 | Tech-Sketch
  • 1