はじめに トピックモデルを抽象的に考えると、アイテムを分類するモデルであり、そのアイテムが単語であろうとユーザーが見た映画であろうと本質的な違いはない。トピックモデルと言ったら、普通の人はまず有名なLDA(Blei et al. 2003)を思いつくが、実は政治学では、このLDAの進化版にあたる構造トピックモデル(STM, structural topic model)が提案された。本記事ではまず、LDAとSTMの違いを紹介した上で、ユーザー行動の可視化(グルーピング、トピック分け)という、トピックモデルの元の目的ではない場面での活用法を説明する。 モデル説明 LDAとSTMの違いはどこなのかというと、豊富なメタデータをモデルに入れることができるところが一番わかりやすい。STMでは、prevalence共変量(機械学習界隈の人にとって特徴量という表現の方がピンとくるかもしれない)とcont
![計量政治学でユーザーの行動パターンを可視化せよ:NLPを超えた構造トピックモデルの活用 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/eda851172454eb48ab7b4b222a06b8d6d2d9cbf7/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZ0eHQ9JUU4JUE4JTg4JUU5JTg3JThGJUU2JTk0JUJGJUU2JUIyJUJCJUU1JUFEJUE2JUUzJTgxJUE3JUUzJTgzJUE2JUUzJTgzJUJDJUUzJTgyJUI2JUUzJTgzJUJDJUUzJTgxJUFFJUU4JUExJThDJUU1JThCJTk1JUUzJTgzJTkxJUUzJTgyJUJGJUUzJTgzJUJDJUUzJTgzJUIzJUUzJTgyJTkyJUU1JThGJUFGJUU4JUE2JTk2JUU1JThDJTk2JUUzJTgxJTlCJUUzJTgyJTg4JUVGJUJDJTlBTkxQJUUzJTgyJTkyJUU4JUI2JTg1JUUzJTgxJTg4JUUzJTgxJTlGJUU2JUE3JThCJUU5JTgwJUEwJUUzJTgzJTg4JUUzJTgzJTk0JUUzJTgzJTgzJUUzJTgyJUFGJUUzJTgzJUEyJUUzJTgzJTg3JUUzJTgzJUFCJUUzJTgxJUFFJUU2JUI0JUJCJUU3JTk0JUE4JnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz0yMmZlY2YzZDAyYzFjZjcyMGM5MWRmZjQ2NGQ3ZGQ5Nw%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwR290b3VidW5fdGFpd2FuJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz00NzQ4ZmNkZGQzMGU2NzQ3ZjIxMjJhMjNkZDA2MmU1Zg%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D3afe94feb07cca71cc903705f038712d)