タグ

statisticsに関するseuzoのブックマーク (58)

  • 世帯の年間収入マップ

  • 年収「300万円未満」や「1000万円以上」の世帯がどの地域に多いのか一目で分かる「世帯の年間収入マップ」

    by Personal Creations 総務省統計局が公開している平成25年住宅・土地統計調査の中には「世帯の年間収入階級(5区分)」というデータがあり、「300万円未満、300万円〜500万円、500万円〜700万円、700万円〜1000万円、1000万円以上」の世帯がどのくらいあるかが調査されているのですが、そのデータを地図上にマッピングしたのが「世帯の年間収入マップ」です。「年収1000万円以上の世帯が5%を超える地域」など指定することで、どの地域にどういう年収の世帯が多いのかが一目でわかるようになっています。 世帯の年間収入マップ http://shimz.me/datavis/mimanCity/ ウェブサイトはこんな感じ。 画面左下から世帯年収を「300万円未満」「300万円~500万円」「500万円~700万円」「700万円~1000万円」「1000万円以上」に設定可能で

    年収「300万円未満」や「1000万円以上」の世帯がどの地域に多いのか一目で分かる「世帯の年間収入マップ」
  • 棋力の男女差は何が原因? 統計分析を行った論文の紹介

    棋力の男女差は何が原因? 統計分析を行った論文の紹介 2015/11/29 2015/12/22 意見所感 チェス, 寄稿 はじめまして。TwitterでUlyemonという名前でつぶやいているものです。 たまたまチェスでの棋力の男女差に関する興味深い論文を見つけ、将棋ワンストップ様に紹介したところ、寄稿させていただけることになりました。ご参考になれば幸いです。 また稿では以下の論文及び論文中の図を引用しており、引用箇所には[*]をつけています。 Christopher F. Chabris,Mark E. Glickman: Sex Differences in Intellectual Performance:Analysis of a Large Cohort of Competitive Chess Players Psychol Sci. 2006 Dec;17(12):104

    棋力の男女差は何が原因? 統計分析を行った論文の紹介
    seuzo
    seuzo 2015/11/30
    「棋力に男女差があるのは、女性が初心者・級位者大会にあまり参加しないため」
  • 「福島の甲状腺がん50倍」論文に専門家が騒がないわけ(下) – Global Energy Policy Research

    (上より続く) 20-50倍は驚く数字か この論文の中では、さらに 「でも、スクリーニング効果で何十倍も発症率を上げるとは考え難い」 という議論もなされています。しかし、例えは過去の韓国の論文によれば、一般人の甲状腺がんのスクリーニングが導入されたことで、甲状腺がんの罹患率が15倍に上がった、というデータがあります。これは10万人当たり約4人であったものが、約60人まで増加しています(図)。(注6) この論文によれば、スクリーニングの受診率が10%上がると、甲状腺がんの発症率が10万人当たり約40人増加したとしています。もし100%に上がったら、単純計算で10万人あたり400人増加、つまり元々の4人から比べ100倍になるという事です。 福島県の子供たちのスクリーニング受診率は100%ではありませんが15%よりはるかに高いので、スクリーニング効果は15倍から100倍の間くらいになることが予測

    seuzo
    seuzo 2015/11/11
    “科学に対する『信頼』が高すぎることで、知識の罠に陥る人が増えています。様々な立場から科学論文・論説が発信されることで、今や自分の意見に合う『証拠集め』をすることはあまりにも容易になってしまいました”
  • 「福島の甲状腺がん50倍」論文に専門家が騒がないわけ(上) – Global Energy Policy Research

    先日、ある学会誌に「福島の子供たちの間で、甲状腺がんが他の地域の20-50倍上がっている」という論文が受理されたようです。(注1)最近になり、この論文が今でも世間で物議をかもしているという事を聞き、とても驚きました。なぜならこの論文は、多少なりとも甲状腺やスクリーニングの知識のある研究者の間ではほとんど問題にされないものだったからです。 しかし、このような研究者の態度がジャーナリストの反応とあまりにかい離しているために、むしろ 「福島の研究者が不当に真実を隠している」という誤解も生んでいるようです。 なぜこのようなかい離が生まれたのでしょうか? ひとつの理由は、統計や疫学、甲状腺がんやスクリーニングに関する知識の違いの差があります。もうひとつは、研究の妥当性と政府に対する批判の妥当性が混在してしまっていることがあるように思います。 ここではまず論文の限界について述べた後、この論文が報道され

  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • 図書館は格差の固定や再生産に加担しているかもしれない問題 - 図書館学徒未満

    武雄市図書館にTSUTAYAの在庫が押しつけられる - Togetterまとめ http://t.co/HqIGyCuNHr @togetter_jpさんから 文化の格差是正装置でもある図書館が金儲けの道具になるのってなかなか皮肉の効いた事態だよね。 — 新橋九段 (@kudan9) 2015, 8月 10 図書館文化の格差是正装置として期待する声は多い。しかし当に、図書館文化格差・知的格差の拡大防止や解消に貢献しているのだろうか? この問題について、稿ではまずid: yuki_o 氏らの興味深い調査『社会階層図書館利用』を紹介する。 これは国会図書館が平成26年度に行った『図書館利用者の情報行動の傾向及び図書館に関する意識調査』という調査結果の分析だ。yuki_o 氏らはこのデータから回答者を「文化」「経済資」「社会関係資」の3つの軸で分類し、それぞれの図書館

    図書館は格差の固定や再生産に加担しているかもしれない問題 - 図書館学徒未満
  • 世界の人口ピラミッド(1950~2100年) - PopulationPyramid.net

    Other indicators visualized on maps: (In English only, for now) AIDS estimated deaths (UNAIDS estimates) Adolescent fertility rate (births per 1,000 women ages 15-19) Age at first marriage, female Age at first marriage, male Age dependency ratio (% of working-age population) Antiretroviral therapy coverage (% of people living with HIV) Antiretroviral therapy coverage for PMTCT (% of pregnant women

    世界の人口ピラミッド(1950~2100年) - PopulationPyramid.net
  • 国勢調査「名前入力できない」続出 | web R25

    9月15日24時時点で1069万世帯以上がインターネットで回答済み。なお、インターネットで回答しなかった世帯には、後日、紙の調査票が配布される ※この画像はサイトのスクリーンショットです 5年に一度実施される国勢調査がスタート。今年は、初めて全世帯を対象にインターネット回答を実施しており、ネットでの回答期間は9月10日から20日までとなっている。ツイッター上には、実際にネットで回答したという人からの報告が続々とあがっているところだが、困惑する声も散見される。 その困惑のひとつは、「名前の入力欄」に関するものだ。ツイッターには、 「国勢調査をインターネット対応しました。名前入力欄でいきなり『入力禁止文字を入力しないでください』の注意MS。戸籍上の正式な漢字なのに腹が立ちました。クレジット会社等は環境依存文字とか優しい言葉なのに。流石お上、見下した言葉、別の言い方があるだろ。ゴメンなさい

    国勢調査「名前入力できない」続出 | web R25
    seuzo
    seuzo 2015/09/18
    人名用漢字に含まれないとエラーになるってことだな。こじらすと感情論になるからなあ。
  • A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログ

    こんにちは、買物情報事業部でサーバサイドの開発を担当している荒引 (@a_bicky) です。 今回のエントリでは R で A/B テストの結果検証を行う方法の一例について紹介します。 エンジニアでも自分の関わった施策の効果検証のために簡単な分析をすることがあるかと思いますが、そんな時にこのエントリが役立てば幸いです。 なお、次のような方は対象外です。 A/B テストや KPI の設計に興味のある方 この辺には全く触れません プログラミング初心者 わからない単語が大量に出てくるでしょう R で統計学や機械学習の手法をバリバリ使いたい方 世の中の “分析” の多くは集計処理がメインです Python, Julia など既に分析する上で使い慣れた言語・ツールがある方 今回のエントリ程度の内容であればわざわざ乗り換える必要もないでしょう OS は Mac を前提として説明するので、Windows

    A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログ
  • 相関係数の大きさに対する目安の歴史的変遷 - Tarotanのブログ

    2022年3月15日 Googleドライブの権限変更のため,ファイルが共有されていませんでした.リンクを変更しました. 「相関係数が0.7あれば、相関が高いと言える」 などの目安を、教科書や入門書で見かけたことは ありませんか? 私は、ちょくちょく目にするのですが、 どこの 誰が いつ 言い出したのか、ずっと不思議に思っています。 下記のリンクにあるPDFファイルで、その歴史的 変遷を追ってみました。 相関係数の大きさに対する目安の歴史的変遷.pdf 相関係数の大きさに対する目安の歴史的変遷.pdf - Google ドライブ 長くてすみません。 上手にまとめることができませんでした。 今回調べたところでは、20世紀初頭のアメリカに おける統計学や教育統計学の入門書において、 いくつかの目安が誕生したようです。 イギリスのGalton, K. Pearson, Spearmanなども 相関

    相関係数の大きさに対する目安の歴史的変遷 - Tarotanのブログ
  • 猛暑日の増加

    [2018-07-20] as.POSIXct() を as.Date() に変えました。 東京管区気象台の東京における雷日数や真夏日等の日数の変化というページを見ると,猛暑日(日最高気温35℃以上)の日数が1876年以来著しく増加していることがわかる。ところが,平均気温を見ると,地球温暖化・都市化の影響で徐々に増加しているが,激しく変わっているようには見えない。平均ではなくて猛暑日の日数を見るべきであるという議論もある。しかし,「猛暑日」(日最高気温35℃以上)や「真夏日」(日最高気温30℃以上)のような分布の裾の日数は,何℃で切るかによって印象が大きく異なる。気温変化を誇張することにならないか。 「東京」の観測地点は2014年12月2日に約900m離れた地点に移転している。詳しくは「東京」の観測地点の移転について(PDF,2014年11月14日,気象庁観測部)を参照されたい。 東京の日

  • 国勢調査2015 キャンペーンサイト ‐ 総務省統計局

    国勢調査2015 キャンペーンサイトです。平成27年、5年に一度の国勢調査が実施されます。皆さまのご理解とご協力をお願いいたします。国勢調査は、非常勤の国家公務員である「国勢調査員」が世帯を訪問する方法によって行われます。調査を進める上での最大のポイントは、すべての人と世帯をもれなく、重複なく調査すること。そのためには、マンション管理人の方や住人の皆様のご協力が必要不可欠です。 日のよりよい未来を築くため、調査へのご協力をお願いします。国勢調査のスケジュールに合わせてご協力をお願いしたいことを具体的にご説明します。

    国勢調査2015 キャンペーンサイト ‐ 総務省統計局
    seuzo
    seuzo 2015/08/04
    高田純次の起用でなごむ国勢調査
  • NHK世論調査 原爆投下日を7割が不正解 NHKニュース

    被爆70年に合わせてNHKが行った世論調査で、広島と長崎に原爆が投下された日付について聞いたところ、正しく答えられなかった人がそれぞれ全国で7割程度に上り、専門家は原爆について意識を高めていく必要があると指摘しています。 まず、広島に原爆が投下された日付について聞いたところ、「昭和20年8月6日」と正しく答えられた人は、広島で69%、長崎で50%、全国で30%でした。 また、長崎に原爆が投下された日付について聞いたところ、「昭和20年8月9日」と正しく答えられた人は、広島で54%、長崎で59%、全国で26%でした。 さらに、「アメリカが原爆を投下したことについて現在、どう考えていますか」と聞いたところ、「今でも許せない」と答えた人は、広島で43%、長崎で46%、全国で49%でした。 一方、「やむを得なかった」と答えた人は、広島で44%、長崎で41%、全国で40%で、広島では、ごく僅かですが

  • 糖質制限食により死亡リスク上昇の可能性 国立国際医療研究センター|ニュース|糖尿病ネットワーク

    糖質制限(低炭水化物)について、長期的な効用は認められず、むしろ死亡リスクが有意に増加するというメタ解析の結果を、国立国際医療研究センター糖尿病研究連携部が1月25日付で発表した。 炭水化物の摂取量を極端に減らす「糖質制限(低炭水化物)」は、短期的には減量や血糖コントロールの改善につながるとして、減量や生活習慣病の事療法のひとつとして注目されている。しかし、長期的な効果や安全性についてはあきらかになっていない。 そこで国立国際医療研究センター病院糖尿病研究連携部の能登洋氏らは、昨年9月までに発表された糖質制限に関する海外の医学論文から、ヒトでの経過を5年以上追跡して死亡率などを調べた9論文をメタ解析*した。対象者は27万2216人(女性66%、追跡期間5〜26年)。総死亡数は1万5981人だった。

    糖質制限食により死亡リスク上昇の可能性 国立国際医療研究センター|ニュース|糖尿病ネットワーク
  • 「王手飛車をかけた方が負ける」は本当か - 盗んだ統計で走り出す

    将棋ニコ生などで頻繁に聞く1「プロの対局では王手飛車をかけたほうが負ける」というジンクス(格言?)が当なのかを自作の将棋解析ライブラリを使って確かめる. 「プロの試合では王手飛車をかけたほうが負ける」とは Wikipediaの「両取り」の項目には,以下のように書いてある. 棋士同士の対局の場合は、「王手飛車をかけた方が負ける」という言葉もある(棋士は王手飛車になる可能性まで踏まえて指しているため)。 また,マイナビの2には次のように書いてある. 「プロは王手飛車をかけたほうが負ける」というセオリー(?)があります。プロが王手飛車を見落とすはずはないので、飛車を取られてもいい読みの組み立てをしているから、という意味です。 また,実際に確かめてみた例として,知恵袋のとある質問の回答中に「『近代将棋』 2002年9月号に,王手飛車をかけたほうが勝率が良かったと書いてあった」という旨の情報が挙

    「王手飛車をかけた方が負ける」は本当か - 盗んだ統計で走り出す
  • 統計学の現在過去未来 --方法論の視点から--

    江口 真透 (統計数理研究所,総合研究大学院) 「現在過去未来」についての原稿依頼がきた.タイトルは茫漠としており,私の狭い研究の興味の範囲,与えられた能力をはるかに超えている.通常の感覚では,依頼を断り自分の研究・教育に専念する方が良いに決まっている.自分の無能さを冷静に見れるだけの苦い経験は積んでいるし,これを論ずるべきもっと適当な人々がいるにちがいない.このように考えた結果,丁重にお断りしようと思った.正直言ってほんの1・2年前までは,統計学の将来に何の疑問点も持っていなかった.「日の統計学は,その長い活動の歴史の中で輝かしい実績を挙げ,今後も着実な成果が期待されている.多種多様な分野において,データを得るための計画から得られたデータに基づいてなされる統計推測まで,著しい貢献が将来に渡って約束され,統計科学は輝き続けるだろう.」こう信じていた.しかしながら現時点1999年は,まさに

  • フジテレビの偏向報道が酷すぎて驚愕!なぜか10代と20代をまとめて、さらに円の中心までずらしたうえで「若い世代の不祥事が目立つ」

    フジテレビが若い世代の不祥事について取り上げた際にあまりにもひどいデータ処理があったとネット上が騒然としている。 これが問題の円グラフだ。一見、何の違和感もないように見えるが、よくよく観察してみるとおかしい。 なんじゃこりゃあああああああ!ツッコミどころが多すぎるぞ。一体何を真剣な顔をして若い世代に問題があると語っているのか。 どうして10代と20代を一緒にまとめているんだよ!しかも円の中心を上にずらす印象操作まで行っている。 ▼正面から見やすくした画像 これはおかしすぎる。変なグラフすぎて30代と40代が同じ78人なのに面積が全然違うことになっているではないか。 netgeek編集部ではグラフを再度作りなおす試みを行った(10代と20代は単純に2で割って計算)。その結果、全く違う景色が見えてきた。 もうグラフを見れば一目瞭然。不祥事を起こしているのは若い世代ではなく、50代が最も多く、次

    フジテレビの偏向報道が酷すぎて驚愕!なぜか10代と20代をまとめて、さらに円の中心までずらしたうえで「若い世代の不祥事が目立つ」
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • Rで線形単回帰分析 - matsuou1の日記

    次回のTokyo.Rの開催が近づいてきたので、前回の復習を兼ねてRで回帰分析をやってみます。 今回は最も単純な線形単回帰分析を行います。 回帰分析の流れ 回帰式を求める意義があるか検討する(説明変数と目的変数のグラフを作成する等) 回帰式を求める 回帰式の精度を確認する 回帰係数の検定を行う 信頼区間と予測区間を求める 回帰式を求める意義があるか検討 無相関なデータに対しても、数学的には回帰式が求められるため、検討しておくことは重要です。 データはマンガでわかる統計学 回帰分析編のデータを使用してみます。 ある喫茶店のアイスティーの売り上げとその日の最高気温についてのデータです。 > norns temperture icetea 8/22 29 77 8/23 28 62 8/24 34 93 8/25 31 84 8/26 25 59 8/27 29 64 8/28 32 80 8/2

    Rで線形単回帰分析 - matsuou1の日記