タグ

統計に関するsnunomuraのブックマーク (2)

  • 「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」など無関係のデータ同士で相関性をむりやり発見する「Spurious Correlations」 - GIGAZINE

    ほんのわずかな初期の要因の変化が最終的に思いがけないほど差のある結果を招く現象を「バタフライ効果」と呼びますが、そんな現象は身近なところでも起こっているのかもしれないと思わせるような、一見すると関係のない2つのデータに相関性を見いだすプロジェクトが「Spurious Correlations」です。 Spurious Correlations http://www.tylervigen.com/ 1999年~2009年までの「アメリカの科学・宇宙・テクノロジーに関する支出」と「首つり自殺数」の上昇傾向が一致。 「水泳プールでの溺死数」と「ニコラス・ケイジの映画出演数」が、なぜか似たような傾向で上下しています。つまり、ニコラス・ケイジが映画に出演しなければプールでの事故が激減するのかもしれません。 「アメリカ人1人あたりのチーズ消費量」と「ベッドシーツに絡まって死亡する数」がほぼ一致。 「ア

    「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」など無関係のデータ同士で相関性をむりやり発見する「Spurious Correlations」 - GIGAZINE
  • クラスター分析について

    はじめまして。 クラスター分析について最近勉強を始めたところです。似たもの同士をくっつけていくというイメージはできましたが、類似度の測定方法やクラスターの合併方法がたくさんありすぎて困っています。そこで、 (1)どうゆう時にどの方法を使うのが効果的なのか? (2)各測定方法、合併方法を使う時の利点と弊害は? 以上2点についてやさしく教えて下さい。 また、詳しく分かりやすく説明してある文献があれば 紹介して下さい。 よろしくお願い致します。 自信はありませんが,手持ちの資料を参考にいくつかアドバイスをしたいと思います.浅学なため間違いがあるかもしれませんので,その点御了承下さい. クラスター分析には実に様々な手法が用意されています. (1)階層的/非階層的 (2)距離(類似性)の算出法 (3)結合(合併)の方法 この三ポイントでどの手法を用いるかが別れていきます.クラスター分析はオプションが

    クラスター分析について
  • 1