タグ

ブックマーク / abrahamcow.hatenablog.com (2)

  • グループドデータの非負値行列因子分解 - 廿TT

    モチベーション たとえばこういう表がある。 gist.github.com 表の左のほうにユーザー層の情報、右の方にユーザー層ごとのブログへのアクセス経路が書かれている。 どのユーザー層がどの経路を好むか知りたいとする。 そこでトピックモデルとしてポアソン分布を使った非負値行列因子分解を考える。 (トピックモデルシリーズ 6 GaP (Gamma-Poisson Model) - StatModeling Memorandum などを参照。) ユーザー層が文書、アクセス経路が単語に対応する。 ユーザー層の情報を捨てて、行列を分解してしまうのはおもしろくない。 ユーザー層の情報を説明変数として、ユーザー層ごとにトピックの構成が変わるようなモデルにしたい。 モデル 観測値を行列の積 で近似することを目指します。 Y: 観測された分解したい行列(N行K列) X: 観測された説明変数(N行J列)

  • A/Bテストのガイドライン:仮説検定はいらない(Request for Comments|ご意見求む) - 廿TT

    記事の編集方針 ※この記事に興味をもたれた方は、 A/Bテスト カテゴリーの記事一覧 - 廿TT も、必要に応じてご覧いただければと思います。 記事はもともとは、「A/Bテストの数理」への批判:「有意」とはなにか の続き的なエントリでした。 しかし、予想外に反響があったため Request for Comments(ご意見求む)の精神で、随時更新している部分もあります。 ただし、ベースとなる主張、Web系施策のA/Bテストに、仮説検定は向かないという部分は変化していません。 もしぼくの考えが変わり、「やっぱ仮説検定、いいかも」となった場合、記事の存在価値はほぼ消滅します。 そのようなことがあれば、ページ最上部に「考えが変わりました」と明記します。 また、他の修正箇所も区別して明記し、差分がわかるようにします。 ただし細かい言い回しや、誤字脱字等はだまって修正します。 目次: そもそも

    A/Bテストのガイドライン:仮説検定はいらない(Request for Comments|ご意見求む) - 廿TT
  • 1