タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

QiitaとpSLAに関するni66lingのブックマーク (1)

  • pLSAとNMFが等価なのか確かめてみた - Qiita

    この記事は古川研究室 Advent_calendar 10日目の記事です。 記事は古川研究室の学生が学習の一環として書いたものです。内容が曖昧であったり表現が多少異なったりする場合があります。 はじめに 文書をクラスタリングする有名な手法として非負値行列因子分解(NMF)や確率的潜在意味解析(pLSA)があります. 2つの手法は実は等価であるらしいので参考論文を読んでメモ書き程度に自分なりにまとめてみました. 詳しくは参考資料をみてください. 与えられるデータについて 各文書を単語の出現頻度で表現するBag of Wordsの形で文書を表現します. $F_{ij}$は$\sum_{i}^{I} \sum_{j}^{J} F_{ij}=1$を満たし、単語$w_i$が文書$d_j$での出現する確率を$p(w_i,d_j)$を表しています. $M$: 単語数 $N$: 文書数 データ行列: $

    pLSAとNMFが等価なのか確かめてみた - Qiita
  • 1