タグ

統計データに関するropparaのブックマーク (1)

  • SNSのユーザー数を推定する手法 | fladdict

    頭いいと言わざるを得ない。それともこういう業界ではスタンダードなのかな? いつか使えるかもしれないのでメモ。 ところでAllenはどうやってユーザー数を推計したのだろう? Ancestry.comのファウンダーとして人口動態統計の専門家であるAllenは巧妙な手法を考案した。Google+にのユーザー名から数百種類の比較的珍しい苗字をサンプルとして抽出し、その数を一般人口中の割合と比較した(アメリカの国勢調査資料を利用)。彼はまたアメリカのユーザー数から世界のユーザー数を推定した。 via TechCrunch おおまか手法としては以下みたいな感じなのかな? ・珍しい苗字のユーザーを検索で収拾。 ・SNSと一般人口で比率が大きく乖離している苗字をノイズとして除去 ・SNS内数と一般人口数の比で、ユーザー数を概算 ・全体的な「偽名を使ってる率」的なものの補正関数をかける どっかで試してみたい

  • 1