タグ

BigDataとPredictionに関するnminoruのブックマーク (2)

  • 選挙直前!ヤフー、ビッグデータで参院選の議席数を予測--実際の結果はいかに?

    ヤフーは7月19日、7月21日に第23回参議院選挙の投票を控え、直前の議席数を予測する「Yahoo! JAPAN ビッグデータレポート」を公開した。ヤフーでは「Yahoo!検索」のデータをもとに6月から議席数を予測しており、今回は第1回、第2回に続く第3弾となる。 7月4日~7月16日までのデータを分析した結果、今回も与党が過半数を超える議席を獲得するという予測は変わらなかった。 ヤフーは、「相関モデル」と「投影モデル」の2つの方法で選挙結果を予測している。相関モデルは、前回の衆議院選挙レポートの結果を元にして分析し、各政党の得票への繋がりやすさを補正した上で、特定期間における検索量から得票数を推定したもの。もう一方の投影モデルは、過去の選挙事例を元に公示日前後における検索量の変化を増加率としてスコア化し、今回の公示前の検索数を用いて得票数を推定したものだ。 下記のグラフは、比例区の最終予

    選挙直前!ヤフー、ビッグデータで参院選の議席数を予測--実際の結果はいかに?
    nminoru
    nminoru 2013/07/20
    (2013/7/25)だいたいあたった。
  • 米国の年間情報消費量は"3.6ゼタバイト" - 米大学が2008年データを報告 | ネット | マイコミジャーナル

    あなたは日々の生活の中でどの程度の"情報"を消費しているのか、あるいは時間を費やしているのだろうか。カリフォルニア州立大学サンディエゴ校(UCSD)が12月9日(現地時間)に発表した最新の調査結果によれば、2008年にアメリカ人全体が"情報"の消費に費やした時間は1兆3,000億時間。その量は3.6ゼタバイト(Zetta-Bytes: テラバイトの10の9乗倍)だったという。個人換算では1日あたり12時間、容量にして34GB、英単語数では10万500語だという。われわれが日々どれだけ"情報"の海に呑まれているかの指標になるだろう。 今回の調査における全体の消費量や時間の集計値 (引用: UCSD) 今回UCSDがまとめたレポート(PDFファイル)は、過去にUCバークレー校(UCB)などがまとめていた「How Much Information?」の最新版にあたる。2000年と2003年に実施

    nminoru
    nminoru 2009/12/11
    データ消費は一人あたり34GB/日。伸びが年率5.4%程度/人が一生の間に生成できるデータは平均1PBよりも少ないという話を聞く。Rawなデータの保存に拘らなければそろそろ情報生産・消費の上限が見えてきたのかも。
  • 1