タグ

webとべき分布に関するkasihara1のブックマーク (2)

  • Zipf曲線とWebサイト人気度

    ※ウェブサイトの収穫逓増に関するJakob Nielsenのコラムへの補足記事 Zipf曲線は、両軸を対数でとった図にプロットすると直線になる。この図はZipf分布になる300の要素による単純なデータセットを示したものだ。データの点を結ぶ線が右図では線形(リニア)になっている点に留意されたい(両軸とも対数でとってある)。普段見慣れたプロットのほとんどは線型である。比較のために、左側の図では同じ要素を線型軸にとってみた。 この図表から明らかなのは、Zipf曲線は、線型軸では座標軸に近づく傾向があるということだ。このために、両軸を対数でとるのが普通なのだが、残念ながら、ほとんどの人はこの種の図の読み取りには慣れていないはずだ。簡単に言うと、Zipf分布になるデータには、簡単にいうと以下のような特徴がある。 わずかな要素が極度に高い値を示す(図の左端) 中くらいの数の要素が、中間的な値を示す(図

    Zipf曲線とWebサイト人気度
  • ベキ分布を示すWebの法則性: DESIGN IT! w/LOVE

    不確実な時代をクネクネ蛇行しながら道を切りひらく非線形型ブログ。人間の思考の形の変遷を探求することをライフワークに。 さて、昨日の「流入キーワードもベキ分布だった!」の続編です。 昨日は、Webサイトに流入してくる検索ワードのアクセス数の分布を見てみましたが、今日はその他のWebサイトのアクセスログの数値に関しても同じように両対数グラフ化することで傾向を調べてみました。 ページ単位でのページビューまずは一般的な企業サイトにおけるページ単位でのページビューの分布を昨日と同じように、両対数グラフで表現してみました。 途中まではベキ分布にみられる直線の分布をみせています。その後、サイトによって傾きは異なりますが、右のほうで急激に傾斜が変わり、曲線を描いているのがわかります。 このグラフが意味するのは、ページビューが少ないページは割と少なく、いわゆるロングテールになっていないということになります。

  • 1