タグ

統計に関するkimuchaのブックマーク (5)

  • 「日本のがん死亡率は先進国のなかで唯一上昇している」の嘘

    ネットでがん治療を調べると、「日のがん死亡率は、先進国の中で唯一上昇している」という話が良く出てきます。そして、この言葉がでるとお決まりのように、日でしか抗がん剤が使われていないからだとか、日の標準治療がひどいという文句がでてきます。この話から病院での治療に不安を感じる方もいます。もちろん、日だけで死亡率が上がっているというのは完全な嘘です。今回はこの嘘について解説したいと思います。 日のがん死亡率は低下し続けている まず、WHOの実際のデータを使って、日のがん死亡率はどうなっているのかをお示しします。WHOサイトのグラフをそのまま以下に引用します。 こちらは、日を含めた各国の「男性のがんによる死亡率」を比較したものです。日は真ん中の図の中で、緑で表されています。日は1990年代後半をピークに、その後はどんどん下がってきています。この傾向はほとんどの先進国で同様です。日

    「日本のがん死亡率は先進国のなかで唯一上昇している」の嘘
  • データ分析の「7つの進化のステップ」を今一度おさらいしてみる - 渋谷駅前で働くデータサイエンティストのブログ

    2016年最初の記事ということで、もはや1月下旬に差し掛かりつつありますがこちらでは改めて、あけましておめでとうございます&年もよろしくお願いいたします。 で、新年一発目のお題は。。。実は似たようなお題で過去にも記事を書いていますが(笑)、年も改まったことなので今一度備忘録的におさらいしてみたいと思います。観点としては、どちらかというと「これからデータ分析のカルチャーを職場に導入していくとしたらどうやってステップアップさせていくか」みたいなところです。なお過去記事はこちら。 この辺の話題を踏まえながら、過去記事リンクのオンパレードで恐縮ですがちょっと一席やってみます。なお以下に挙げる「ステージ」はあくまでも一例であり、業界によってはもっと高度な方向に展開させられる(orもっとプリミティブなレベルに留まる)こともあるので、参考程度に見てもらえればと。 特にここでは「まだデータ分析を始めてい

    データ分析の「7つの進化のステップ」を今一度おさらいしてみる - 渋谷駅前で働くデータサイエンティストのブログ
  • いかにしてデータは人を騙すのか

    テレビ、新聞、ネット、世の中にはたくさんの情報が氾濫していますが、そのほとんどが偏ったデータであると考えるべきです。情報を取捨選択するには、まずは疑ってかかることが重要です。 たとえば、テレビ番組などでよくある「渋谷で100人に聴きました」なんてツッコミどころが満載です。そもそも、100人という分母が少なすぎますし、渋谷が日全体の縮図とは限らないのです。渋谷と秋葉原で恋愛に関する質問をした時、同じ結果が得られるでしょうか?やってみなきゃ分りませんが。 このように、世の中には偏った情報が溢れかえっています。今回は、統計などのデータを利用した印象操作について書いていこうと思います。 グラフを使った印象操作 ある情報をグラフで提示する時、グラフの描き方一つで全く異なる印象を与えることができます。下のグラフを見て下さい。 縦軸を0から描いたグラフです。このグラフですと、売上の伸びがイマイチな印象

    いかにしてデータは人を騙すのか
  • 年収「300万円未満」や「1000万円以上」の世帯がどの地域に多いのか一目で分かる「世帯の年間収入マップ」

    by Personal Creations 総務省統計局が公開している平成25年住宅・土地統計調査の中には「世帯の年間収入階級(5区分)」というデータがあり、「300万円未満、300万円〜500万円、500万円〜700万円、700万円〜1000万円、1000万円以上」の世帯がどのくらいあるかが調査されているのですが、そのデータを地図上にマッピングしたのが「世帯の年間収入マップ」です。「年収1000万円以上の世帯が5%を超える地域」など指定することで、どの地域にどういう年収の世帯が多いのかが一目でわかるようになっています。 世帯の年間収入マップ http://shimz.me/datavis/mimanCity/ ウェブサイトはこんな感じ。 画面左下から世帯年収を「300万円未満」「300万円~500万円」「500万円~700万円」「700万円~1000万円」「1000万円以上」に設定可能で

    年収「300万円未満」や「1000万円以上」の世帯がどの地域に多いのか一目で分かる「世帯の年間収入マップ」
  • むしろ数式が苦手だけど統計を勉強したいという人はRをやるといいかもしれない - Line 1: Error: Invalid Blog('by Esehara' )

    はじめに なぜか唐突にRブームが俺の中でやってきてしまってどうしようもないので、Rのを注文しまくってたりしていたら、下のようなの山が出来てしまいました。 これらのを付箋でペタペタしながら読み進めていくうちに、段々とRというのはどういう言語で、どういう風に勉強するといいのか、という方針が固まってきたので、ここにメモをしておきます。 Rとはどのような言語か 一言で、しかも乱暴に言ってしまうならば「統計に特化したPHP」というのが一番雰囲気を伝えられるかもしれない。いや、PHPの悪評は知っているし、ガチでRをやっている人にとっては嫌がられることもわかっているけど、あえてそういう説明が、あくまで入り口としてはわかりやすいのではないかと。 どういうことかというのを言い訳します。 自分が読んだ感じだと、統計というのは、「何らかのデータ」と「分析するためのツールとしての数式」と「その数式が意図する

    むしろ数式が苦手だけど統計を勉強したいという人はRをやるといいかもしれない - Line 1: Error: Invalid Blog('by Esehara' )
  • 1