タグ

統計とコンピュータに関するkana321のブックマーク (2)

  • 全世界の情報を集めると295エクサバイトに、そのうち94%はデジタル化済み

    南カリフォルニア大学の研究チームによると、全人類が全世界中に保持している情報の容量は295エクサバイト(1,000,000,000,000,000,000バイト、百京バイト)に達しており、CD-ROMに入れて積み上げると地上から月まで届いて、さらにその月からそれまでの距離の4分の1ほど通り過ぎるぐらいになるとのこと。これはデジタルとアナログの両方の情報を含んだ場合の数。これらのうち94%がデジタル化されているそうで。 そんなわけで、全人類の持っている情報の想像を絶する実態は以下から。 How Much Information Is There in the World? - USC News Ultimate hoarding: Study finds mankind could store 295 exabytes of data この研究データが対象にしている期間は1986年から200

    全世界の情報を集めると295エクサバイトに、そのうち94%はデジタル化済み
    kana321
    kana321 2014/06/03
    これはデジタルとアナログの両方の情報を含んだ場合の数。これらのうち94%がデジタル化されているそうで
  • 分散の定義が絶対値を使わず二乗を使う理由(?) - 結城浩のはてなブログ

    1. 確率変数Xの分散V(X)は、Xの期待値をE(X)とすると、V(X) = E( (X - E(X) )^2)で定義される。 2. 言い換えれば、分散とは「「期待値からのずれ」の二乗」の期待値である。 3. 分散は、確率変数の値がどれだけ期待値からずれるかを表すもの(として定義したい)。 4. 期待値からのずれは大きくずれる場合と小さくずれる場合の二つがある。 5. 二乗しておけばどっちに転んでも大丈夫。 6. でも、絶対値を取ることにしてもいいよね。 7. いいけど、絶対値とる計算よりも二乗するほうが計算便利だし。 …と、ここまではいいと思うんですが、以下のA,Bも二乗する定義を採用する理由になるでしょうか? A. 分散に対して、等式 V(X) = E(X^2) - (E(X))^2 が成り立つ。 《分散は、平方の期待値から期待値の平方を引いた値になる》 B. 確率変数Xが期待値からず

    分散の定義が絶対値を使わず二乗を使う理由(?) - 結城浩のはてなブログ
  • 1