タグ

2016年3月28日のブックマーク (2件)

  • Tweedie分布のパラメータを推定する - StatModeling Memorandum

    @dichikaさんのブログ記事でTweedie分布の存在を知りました。Stanのメーリングリストでも「推定できないの?」という質問は過去にありましたが、多忙のBobさんからは「summing out(離散値をとるパラメータの和をとって消去)すればできるかもねー」という素っ気ない返答がありました。僕でもできたので備忘録として残します。 まずTweedie分布の紹介からします。 [1] Smyth, G. K. (1996) Regression modelling of quantity data with exact zeroes. Proceedings of the Second Australia-Japan Workshop on Stochastic Models in Engineering, Technology and Management. Technology Man

    Tweedie分布のパラメータを推定する - StatModeling Memorandum
    Diomedeidae
    Diomedeidae 2016/03/28
    Tweedie分布をSTANで実装する手法について紹介。離散パラメータが含まれるので、和を取って消去する必要があるとのこと。ゼロ過剰なデータを扱うなら有効。
  • ややこしい離散分布に関するまとめ - 作って遊ぶ機械学習。

    今回は離散分布(discrete distribution)の代表格である多項分布(multinomial distribution)や、その共役事前分布であるディリクレ分布(Dirichlet distribution)との関係性や計算方法を整理したいと思います。 離散分布というと、来はポアソン分布(Poisson distribution)なども含めた離散値を出力するような分布全般のこと指します。しかし実際に論文などを読んでいると、くじ引きのように単純に出目の比率が与えられたような分布を離散分布と名付けてしまっている場合もよく見られます。まぁ文脈的に誤解を招くことはあまりないと思うのですが、くじ引きの分布をもっとキッチリ表現するなら、複数あるカテゴリーから1つを抽出するという意味でカテゴリカル分布(categorical distribution)と呼ぶのが適切かと思います。あるいは