タグ

LDAに関するAobeiのブックマーク (3)

  • 計量政治学でユーザーの行動パターンを可視化せよ:NLPを超えた構造トピックモデルの活用 - Qiita

    はじめに トピックモデルを抽象的に考えると、アイテムを分類するモデルであり、そのアイテムが単語であろうとユーザーが見た映画であろうと質的な違いはない。トピックモデルと言ったら、普通の人はまず有名なLDA(Blei et al. 2003)を思いつくが、実は政治学では、このLDAの進化版にあたる構造トピックモデル(STM, structural topic model)が提案された。記事ではまず、LDAとSTMの違いを紹介した上で、ユーザー行動の可視化(グルーピング、トピック分け)という、トピックモデルの元の目的ではない場面での活用法を説明する。 モデル説明 LDAとSTMの違いはどこなのかというと、豊富なメタデータをモデルに入れることができるところが一番わかりやすい。STMでは、prevalence共変量(機械学習界隈の人にとって特徴量という表現の方がピンとくるかもしれない)とcont

    計量政治学でユーザーの行動パターンを可視化せよ:NLPを超えた構造トピックモデルの活用 - Qiita
  • BERTを使用したトピックモデリング

    BERTを使用したトピックモデリング BERTとTF-IDFを活用して、簡単に解釈できるトピックを作成します。 製品の所有者からNLPベースの分析を依頼されると、通常、次の質問があります。 「これらのドキュメントで頻繁に見つかるトピックはどれですか?」 カテゴリやラベルがない場合、これらのトピックを抽出するための教師なし手法、つまりトピックモデリングを調べる必要があります。 LDAやNMFなどのトピックモデルは良い出発点であることが示されていますが、意味のあるトピックを作成するには、ハイパーパラメータの調整を通じてかなりの努力が必要だと常に感じていました。 さらに、BERTなどのトランスベースのモデルを使用したかったのは、過去数年間にさまざまなNLPタスクで驚くべき結果を示したからです。事前にトレーニングされたモデルは、単語や文のより正確な表現が含まれているはずなので、特に役立ちます。 数

    BERTを使用したトピックモデリング
  • トピックモデル(LDA)で初学者に分かりづらいポイントについての解説 - Taste of Tech Topics

    こんにちは。 信号処理で使っていた数学の知識を生かして、 機械学習関連の仕事をしている2年目の@maron8676です。 こちらは機械学習数学 Advent Calendarの11日目の記事となります。 qiita.com トピックモデルの学習で初学者に分かりづらいポイントについての解説をしていきます。 機械学習における数学の重要性 機械学習を利用してアプリケーションを作る際に、数学の知識は重要です。 機械学習の便利なライブラリは多くリリースされていますが、適切に使用するにはパラメータチューニングが必要だったり、 最新の手法を動かしたい場合は自分で数式を読んで理解し、開発しないといけません。 というわけなので、数学は大事です。機械学習でアプリケーションを作るみなさん数学を勉強しましょう。 トピックモデル トピックモデルとは何か トピックモデルは潜在的意味を推定するためのモデルです。 トピ

    トピックモデル(LDA)で初学者に分かりづらいポイントについての解説 - Taste of Tech Topics
  • 1