Topic model Presentation Transcript Topic model April 8, 2014 1 / 35 Topic model Topic model 文書などのデータには、そこに現れる語に潜在的なトピック (話題) がある と考え、文書からトピックを推定するモデル トピックが分かると、類似する文書を分類 (クラスタリング) 可能に 個々の語ではなくトピックを単位として考えることで、類義語の集約が 可能に (eg. 「ネコ」と「猫」を同じ語とみなせる) 類義語を集約することで、処理精度が向上 (eg. 「ネコ」で検索したとき、「猫」を含むページを発見可能に) 類義語を集約することで、必要なメモリ・時間が少なく 2 / 35 特異値分解 (SVD) Singular Value Decomposition(SVD) 任意の行列 A に対し r ∶= rank
![Topic model](https://cdn-ak-scissors.b.st-hatena.com/image/square/a81af7430d34cdb318eecde395f65ff4f1977727/height=288;version=1;width=512/http%3A%2F%2Fimage.slidesharecdn.com%2Fslide-topicmodel-140408081031-phpapp02%2F95%2Fslide-1-638.jpg%3Fcb%3D1396963040)