mitsuba3のブックマーク - はてなブックマーク

【Rで自然言語処理】単語の出現パターンをクラスタリングする。 - データ分析系男子。
前回、前々回とトピックモデルに関する話題を扱いました。 wanko-sato.hatena blog.com wanko-sato.hatena blog.com トピックモデルは嫌いじゃない、むしろ好きなんですが、結果の解釈が面倒なのと、やっぱり確率分布を使うため、結果にどこかふわっとした感じが残るあたり、どうにもモヤってしまうのです。もちろん、そういうのを織り込み済みであることを分かってもらえれば良いのですが、LDAはどうにも説明がややこしいところがございまして、簡便な方法で、細かい説明をしなくてもすぐにわかってもらえる指標ってないのかなぁ、とあれこれ考えているところでございます。その中でも、最近思いついた中で個人的にヒットしているのが「単語の出現パターン」でございまして。今日はそのお話をしようと思います。そもそもの経緯早速やってみよう対象とするデータデータの概要単語の出現頻度
mitsuba3 2019/01/18
リンク
1

はてなブックマーク