タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

統計に関するmuyoujinnのブックマーク (4)

  • Gapminderr

    Gapminder uses cookies to improve its statistics and user experience. By continuing to use the site you agree to our cookie policy. X Close

  • 統計的消去で擬似相関を見抜こう! - ほくそ笑む

    今日は初心者向け記事です。 はじめに ある範囲の年齢の小学生32人を無作為に選び、算数のテストを受けてもらい、さらにその身長を測定しました。 身長に対する算数の点数のグラフは次のようになりました。 なんと、身長の高い子供の方が、算数の点数が高いという結果になりました! 身長が算数の能力に関係しているなんて、すごい発見です! しかしながら、結論から言うと、この結果は間違っています。 なぜなら、抽出したのは「ある範囲の年齢の小学生」であり、年齢の高い子も低い子も含まれているからです。 年齢が高いほど算数能力は高くなり、年齢が高いほど身長も高くなることは容易に推測できます。 この関係を図で表すと次のようになります。 つまり、年齢と算数能力に相関があり、年齢と身長にも相関があるため、身長と算数能力にも見かけ上の相関が見えているのです。 このような相関を擬似相関と言います。 統計解析では、このような

    統計的消去で擬似相関を見抜こう! - ほくそ笑む
  • むしろ数式が苦手だけど統計を勉強したいという人はRをやるといいかもしれない - Line 1: Error: Invalid Blog('by Esehara' )

    はじめに なぜか唐突にRブームが俺の中でやってきてしまってどうしようもないので、Rのを注文しまくってたりしていたら、下のようなの山が出来てしまいました。 これらのを付箋でペタペタしながら読み進めていくうちに、段々とRというのはどういう言語で、どういう風に勉強するといいのか、という方針が固まってきたので、ここにメモをしておきます。 Rとはどのような言語か 一言で、しかも乱暴に言ってしまうならば「統計に特化したPHP」というのが一番雰囲気を伝えられるかもしれない。いや、PHPの悪評は知っているし、ガチでRをやっている人にとっては嫌がられることもわかっているけど、あえてそういう説明が、あくまで入り口としてはわかりやすいのではないかと。 どういうことかというのを言い訳します。 自分が読んだ感じだと、統計というのは、「何らかのデータ」と「分析するためのツールとしての数式」と「その数式が意図する

    むしろ数式が苦手だけど統計を勉強したいという人はRをやるといいかもしれない - Line 1: Error: Invalid Blog('by Esehara' )
  • 「喫煙率が下がると肺がん死が増える」のはなぜか? - NATROMのブログ

    武田邦彦氏が、「どうも何かを間違っているような気がします」という保留付きながら、「タバコを吸わない人に対して、タバコを吸うと肺がんの死亡率は10倍以上減る」という推論をしていました。 ■武田邦彦 (中部大学): 奇っ怪な結果?? タバコを吸うと肺がんが減る?! でも、なにか釈然としなかったので、1955年頃から1985年頃までの統計的データから、「タバコを吸うと何倍ぐらい肺がん(気管、気管支を含む)になりやすいのか?」という計算をしてみました。基礎となるデータは厚労省やがんセンターなどから出ている男性のものを使い(下の図。データ自体は誰も異議がないと思います)、次の前提を起きました。 1) タバコの害は継続的に20年ぐらい吸った人が、さらに20年ぐらい後に肺がんになる(そのために1985年以後の喫煙率のデータは使えません。1985年の20年後は2005年になり、それ以後はデータがまだ無いか

    「喫煙率が下がると肺がん死が増える」のはなぜか? - NATROMのブログ
  • 1