Zipf分布といえば,べき乗則でおなじみの分布です(http://en.wikipedia.org/wiki/Zipf%27s_law).一方,Zipf-MandelbrotはZipf分布を一般化したものだそうです(http://en.wikipedia.org/wiki/Zipf%E2%80%93Mandelbrot_law). Zipf-MandelbrotのPDFは f(x) = c / (x + b)^aとなるわけですが,今回はより単純な形式である, f(x) = 1 / xというPDFに従う乱数を生成する方法を説明します. まず,CDFを求めてみます.ただし,PDFの積分は ∫f(x) dx = ln(x) + C (Cは積分定数)であるけれど,F(0) = 0なのでCDFは F(x) = ln(x)となります. 次に,F(x)の逆関数をもとめます. y = ln(x) e^y
※ウェブサイトの収穫逓増に関するJakob Nielsenのコラムへの補足記事 Zipf曲線は、両軸を対数でとった図にプロットすると直線になる。この図はZipf分布になる300の要素による単純なデータセットを示したものだ。データの点を結ぶ線が右図では線形(リニア)になっている点に留意されたい(両軸とも対数でとってある)。普段見慣れたプロットのほとんどは線型である。比較のために、左側の図では同じ要素を線型軸にとってみた。 この図表から明らかなのは、Zipf曲線は、線型軸では座標軸に近づく傾向があるということだ。このために、両軸を対数でとるのが普通なのだが、残念ながら、ほとんどの人はこの種の図の読み取りには慣れていないはずだ。簡単に言うと、Zipf分布になるデータには、簡単にいうと以下のような特徴がある。 わずかな要素が極度に高い値を示す(図の左端) 中くらいの数の要素が、中間的な値を示す(図
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く