タグ

analyticsとdataに関するHeavyFeatherのブックマーク (3)

  • むしろ数式が苦手だけど統計を勉強したいという人はRをやるといいかもしれない - Line 1: Error: Invalid Blog('by Esehara' )

    はじめに なぜか唐突にRブームが俺の中でやってきてしまってどうしようもないので、Rのを注文しまくってたりしていたら、下のようなの山が出来てしまいました。 これらのを付箋でペタペタしながら読み進めていくうちに、段々とRというのはどういう言語で、どういう風に勉強するといいのか、という方針が固まってきたので、ここにメモをしておきます。 Rとはどのような言語か 一言で、しかも乱暴に言ってしまうならば「統計に特化したPHP」というのが一番雰囲気を伝えられるかもしれない。いや、PHPの悪評は知っているし、ガチでRをやっている人にとっては嫌がられることもわかっているけど、あえてそういう説明が、あくまで入り口としてはわかりやすいのではないかと。 どういうことかというのを言い訳します。 自分が読んだ感じだと、統計というのは、「何らかのデータ」と「分析するためのツールとしての数式」と「その数式が意図する

    むしろ数式が苦手だけど統計を勉強したいという人はRをやるといいかもしれない - Line 1: Error: Invalid Blog('by Esehara' )
  • Facebook 日本人ユーザ約1150万人のユーザ ID を集めてみました | ぱろすけのメモ帳

    以前、 [婚活] facebook で日人ユーザの ID 一覧を取得する という記事を書きました。そこで示したスクリプト(をちょっと改変したもの)をぐるんぐるん回し、日人ユーザとして登録されている人のユーザ ID が1150万人分ほど集まりましたので、ここに共有したいと思います。 原理としては、 facebook の全ユーザについて、ユーザ ID 1番から順番に地域をチェックし、日と登録されているもののみその ID を保存しています。これだけの日人を得るために数十億人分の ID をチェックしてます。 [ ダウンロード fb_jpn_ids.zip ] 解凍していただきますと、2つのフォルダがあります。”type1″ フォルダには100000000000000番以降のものが、 “type2″ にはそれ以前のものが、適当に分割されて格納されています。 https://www.face

  • Twitterユーザーで100人以上フォロワーがいるのはたった6.4%だけ【グラフ有り】 | ついーたーTweeter.jp

    2009年6月にsysomos社が1,150万ものアカウントから集計したTwitterに関する統計からのデータ第2弾です。 前回はつぶやきの動向についてお伝えしましたが、今回は「フォロー」活動についてのデータをご紹介します。 なお、このデータは2009年6月時点でのものであり、その後もユーザー数や利用は増え続けています。 これは、ユーザーが何人フォローしているかのデータです。92.4%のTwitterユーザー100人未満しかフォローしていません。ということは、7.6%の人は100人以上をフォローしているということですね。更に、2.2%の人は実に400人以上をフォローしています。 これは、ユーザーが何人にフォローされているかのデータです。100人以上のフォロワーがいるユーザーは実に全体の6.4%しかいないことになります。 これは、フォローワーの数に対し平均何人をフォローしているかのデータです

  • 1