モチベーション たとえばこういう表がある。 gist.github.com 表の左のほうにユーザー層の情報、右の方にユーザー層ごとのブログへのアクセス経路が書かれている。 どのユーザー層がどの経路を好むか知りたいとする。 そこでトピックモデルとしてポアソン分布を使った非負値行列因子分解を考える。 (トピックモデルシリーズ 6 GaP (Gamma-Poisson Model) - StatModeling Memorandum などを参照。) ユーザー層が文書、アクセス経路が単語に対応する。 ユーザー層の情報を捨てて、行列を分解してしまうのはおもしろくない。 ユーザー層の情報を説明変数として、ユーザー層ごとにトピックの構成が変わるようなモデルにしたい。 モデル 観測値を行列の積 で近似することを目指します。 Y: 観測された分解したい行列(N行K列) X: 観測された説明変数(N行J列)