タグ

statisticsに関するpongepongeのブックマーク (16)

  • 統計不正、検査院が国会報告せず 「行間に書き込んだつもり」:朝日新聞デジタル

    ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

    統計不正、検査院が国会報告せず 「行間に書き込んだつもり」:朝日新聞デジタル
    pongeponge
    pongeponge 2021/12/20
    『行間に書き込んだつもり』行間を読む教育の最終形態かな
  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上でべログの星の数について、 ある問題が話題になりました。 べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 べログは飲店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、

    食べログ3.8問題を検証 - クイックノート
  • 「賃金構造基本統計」も不適切 問題の統計は23に | NHKニュース

    厚生労働省が不適切な手法で統計調査を行っていた問題で、政府は新たに厚生労働省の「賃金構造基統計」で決められた手法で調査が行われていなかったと発表しました。これで問題が見つかった基幹統計は7つの省庁の23統計となりました。 総務省は28日夜、緊急に会見を開き、新たに賃金の実態を労働者の雇用形態や職種ごとに把握するために厚生労働省が行っている「賃金構造基統計」で、決められた手法で調査が行われていなかったと発表しました。 具体的には、総務大臣から承認を受けた計画では調査員が事業所に出向き対面で調査すべきところを、ほぼすべてで用紙を郵送で送り、回収していたほか、バーなど一部の業種を調査対象から外していたということです。 これで問題が見つかった基幹統計は7つの省庁の23統計で、延べ34の手続き上のミスとなりました。 点検結果の取りまとめにあたった総務省によりますと、政府がミスなどがみつかった統計

    「賃金構造基本統計」も不適切 問題の統計は23に | NHKニュース
  • 厚生労働省のコンドームの統計資料にミスがあるかも - 人生万事こじらせるべからず

    勤労統計に誤りがあったが、元の資料が廃棄されてしまっている……というニュースを見てショックを受けました。 「もしかしてコンドームの出荷量の元資料も残ってないのか!?!?」 ライフワークとしてコンドームの出荷量について調べていたところ、15年ほど前までのデータについては他の誰かが作ってくれたグラフが残っていたのですが、最新のものについてはグラフが見つからなかったのです。 そこで、厚生労働省が発表している薬事工業生産動態統計調査から、コンドームの出荷量をひっぱって自力でグラフを作ることにしました。 www.mhlw.go.jp そしたらですね、一か月だけ外れ値を見つけてしまいました。 2009年12月だけコンドームの出荷量が普通の月の20倍になっている様子をご覧ください。 毎月、コンドームは2000〜3000万個の出荷量なのですが、2009年12月においては4億6000万個出荷していることにな

    厚生労働省のコンドームの統計資料にミスがあるかも - 人生万事こじらせるべからず
  • 政府基幹統計、4割の22統計に間違い 抽出方法など:朝日新聞デジタル

    「毎月勤労統計」をめぐる厚生労働省の不正調査問題をうけ、政府が56ある基幹統計が適正に調査されているか点検した結果、4割にあたる22統計に計31件の間違いなど何らかの問題があったことが24日、わかった。このうち統計法違反に該当する可能性がある間違いも21統計あった。 点検結果をまとめた総務省が同日発表した。24日夜に記者会見した三宅俊光・総務省政策統括官は、「(過少給付につながった)毎月勤労統計のような重大な事案はなかった」としているが、政府の統計の取り扱いのずさんさが改めて浮き彫りになった形だ。統計を所管する同省は今後、調査結果を同省の統計委員会に諮り、233ある一般統計も含めて点検し、再発防止策を探る「専門部会」も新たに作る方針。 データの数値に誤りがあったのは国土交通省の「建設工事統計」。1事業者が施工高などを「百万円単位」で書くべきところ、「万円単位」で記入したため、公表した全体の

    政府基幹統計、4割の22統計に間違い 抽出方法など:朝日新聞デジタル
    pongeponge
    pongeponge 2019/01/25
    責任者がいると思うんだけど、何してたんだろう?
  • データ分析の不思議、シンプソンのパラドックスを統計的因果推論から考える - Unboundedly

    今回は統計学で有名な「シンプソンのパラドックス」という問題について紹介したいと思います。簡単にいえば、同じデータでも分析の仕方によって全く矛盾したように見える結果が得られるというお話です。データだけ見ると、信じがたいような直感に反する現象がおきるので頭の体操としてとても面白いです。 あまりに有名なパラドックスであるため日語でも解説がいくつか出ていますが、人によって言っていることが違っていたり、不完全であったりします。多くはシンプソンによるオリジナルの論文を読んでないことから起因するのだと思います。 例えばシンプソンのパラドックスを交絡の問題だと捉える人は多いですが、個人的に不完全だと思います(間違いではない)。このように誤解が広まった歴史的背景も含めて、詳しく書いていきたいと思います。ちなみにアニメのシンプソンズはこの問題と全く無関係です。 そもそもシンプソンのパラドックスとは? シンプ

    データ分析の不思議、シンプソンのパラドックスを統計的因果推論から考える - Unboundedly
  • 「母集団」の意味間違えてる奴多すぎ問題

    わかってますよ風にドヤ顔でブコメつけてるのに間違ってるのは恥ずかし過ぎる bushimichi そもそも新聞社の思惑で誘導尋問しまくってそれを世論調査といってることがねぇ。。。統計の母集団の正当性は固定電話とネットでも大差ない。 netcraft3 層化無作為二段抽出法やRDDが必ずしもベストというわけではないけど母集団の偏りが少ないベターな方法。標調査を理解せず数の多さだけ比較されても意味ない。 famnet 当然。母集団の偏り。数BかCでやらないか?というか、やってなくても常識的にわかるだろ感 https://ja.wikipedia.org/wiki/%E5%81%8F%E3%82%8A 仮に安倍政権に関する世論調査として3000人に調査をしたとする。この3000人を「母集団」だと思ってんだろ?違うよ!それは標だよ! 「母集団」ってのは調査したい集団全体のことだよ!世論調査であれ

    「母集団」の意味間違えてる奴多すぎ問題
    pongeponge
    pongeponge 2018/04/25
    そうだったのか。母集団と標本の違いが分からなくて、同じ物を違う名前で呼んでるんだと思ってたよ。
  • 統計検定を理解せずに使っている人のために I - J-Stage

    318 化学と生物 Vol. 51, No. 5, 2013 セミナー室 研究者のためのわかりやすい統計学-1 統計検定を理解せずに使っている人のために I 池田郁男 東北大学大学院農学研究科 319 化学と生物 Vol. 51, No. 5, 2013 1 1 320 化学と生物 Vol. 51, No. 5, 2013 2 μ σ σ 3 * 2 3 * 321 化学と生物 Vol. 51, No. 5, 2013 4 * 5 * 6 σ 4 5 6 σ * * 322 化学と生物 Vol. 51, No. 5, 2013 μ μ μ μ μ σ 7 σ σ σ σ σ σ σ σ σ σ 8 8 9 7 σ 323 化学と生物 Vol. 51, No. 5, 2013 9 10 11 * σ σ * * * * 10 11 * * * * 324 化学と生物 Vol. 51, No.

    pongeponge
    pongeponge 2018/03/18
    帰無仮説とか未だによく分からん
  • NHKさん、ビッグデータかAIかよくわからない視覚化した統計情報のようなもので、相関性が不安になる内容を特番で放送予定 - Togetterまとめ

    ■(2017年7月19日追記)「しがらみのない奇抜な提言は”AI”ではなく製作者側の意図」との証言がありましたので別途まとめました→ https://togetter.com/li/1131398 ■因果関係と相関関係について ・因果関係がないのに相関関係があらわれる4つのケースをまとめてみたよ(質問テンプレート付き) http://takehiko-i-hayashi.hatenablog.com/entry/20130418/1366232166 ・相関関係と因果関係の違いが一発でわかる具体例5選 http://atarimae.biz/archives/7374 続きを読む

    NHKさん、ビッグデータかAIかよくわからない視覚化した統計情報のようなもので、相関性が不安になる内容を特番で放送予定 - Togetterまとめ
  • 京都女子大生、ビッグデータ解析で世界一 専門知識なし:朝日新聞デジタル

    京都女子大(京都市東山区)の3年生4人が、ビッグデータから傾向や規則性を見つける「データマイニング」の国際コンペで優勝した。正答率は参加53チームで最高。専門知識は一切なく、世界一に輝いた。 4人は現代社会学部の中原英里さん(22)、松浦由希さん(21)、松美紗子さん(21)、武藤陽穂(あきほ)さん(21)。指導した小波秀雄教授(統計学)は「情報理工系でない学生の優勝は努力のたまもの。受賞を自信につなげてほしい」。 コンペはアジア太平洋地域で知識工学を発展させようと、情報工学系の国際会議「ICONIP」が毎年開催。今年は7~9月に実施され、周辺各国の参加学生たちが競い合った。 出題は「暗号化された新聞記事… この記事は有料会員記事です。有料会員になると続きをお読みいただけます。 この記事は有料会員記事です。有料会員になると続きをお読みいただけます。 この記事は有料会員記事です。有料会員に

    京都女子大生、ビッグデータ解析で世界一 専門知識なし:朝日新聞デジタル
    pongeponge
    pongeponge 2015/11/30
    肝心の内容が説明されてなくてよくわからない。
  • 相関係数の大きさに対する目安の歴史的変遷 - Tarotanのブログ

    2022年3月15日 Googleドライブの権限変更のため,ファイルが共有されていませんでした.リンクを変更しました. 「相関係数が0.7あれば、相関が高いと言える」 などの目安を、教科書や入門書で見かけたことは ありませんか? 私は、ちょくちょく目にするのですが、 どこの 誰が いつ 言い出したのか、ずっと不思議に思っています。 下記のリンクにあるPDFファイルで、その歴史的 変遷を追ってみました。 相関係数の大きさに対する目安の歴史的変遷.pdf 相関係数の大きさに対する目安の歴史的変遷.pdf - Google ドライブ 長くてすみません。 上手にまとめることができませんでした。 今回調べたところでは、20世紀初頭のアメリカに おける統計学や教育統計学の入門書において、 いくつかの目安が誕生したようです。 イギリスのGalton, K. Pearson, Spearmanなども 相関

    相関係数の大きさに対する目安の歴史的変遷 - Tarotanのブログ
    pongeponge
    pongeponge 2015/08/18
    誰が言い出したか?はあまり気にならなかったけど、なぜその値で高いと言えるのか?は非常に気になってた。
  • 10秒以内にウォーリーを探す合理的な方法

    これが大人だ! 「ウォーリーを探せ」って絵、覚えてますか? そう、このごちゃごちゃした人混みから赤と白のボーダーの服を着たウォーリーを探し出すゲーム。子どものころ必死で探した覚えがあります。でも見つけられないときって、ほんとに見つからないんですよね…。試しに今すぐ探してみてください。上の画像のウォーリー、いました? 「…ま、気長に探すしかないよね〜」で許されるのは子どものときだけです。そう、大人というものは、短時間で効率的に結果を出すことが求められます。それはウォーリーを探すことだって同じなのです。 ではウォーリーのいる場所には、規則性があるのでしょうか。実はSlateが、シリーズ7冊中68カ所のウォーリーの居場所をリストアップしています。それがこちら。 …あまり規則性は見えてこないですね。強いて言えば、真ん中よりちょっと上と下にそれぞれ、なんとなく集まっているくらい。でもまだ結論づける

    10秒以内にウォーリーを探す合理的な方法
  • 「幸せは加速度センサで測れる」:日経ビジネスオンライン

    矢野:そうですか。 店舗の中で、居場所と体の動きを検知できるセンサを従業員が身に着けて、来店したお客様にも買い物の間だけ身に着けてもらい、毎秒20回ずつひたすらデータを取り続けるわけですが、それを解析した人工知能コンピュータがすごく意外な影響要因をはじき出した。 店内のいくつかの「ある特定の場所」に従業員が「いる」だけで顧客単価が向上するというんですね。そこでの滞在時間を1.7倍にしただけで顧客単価が15%も増えたとか。でもそれがどういう理由なのか言葉ではうまく説明できない。これは、具体的にはどういうことをコンピュータでやっているんですか。 矢野:ごく単純に言うと、1人のお客さんがいくらお金を使うかという売り上げというマクロな量に対して、影響を与えるかもしれない要因はものすごくたくさんあります。そのたくさんの要因の中で、影響がありそうな候補を何千個、何万個と自動で作り出し、かつそれらを絞り

    「幸せは加速度センサで測れる」:日経ビジネスオンライン
    pongeponge
    pongeponge 2014/08/29
    幸せを計測して改善される社会へ/逆に「こいつ異常に幸せすぎる」っていうデータも取れるんだろうなぁ
  • 「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」など無関係のデータ同士で相関性をむりやり発見する「Spurious Correlations」 - GIGAZINE

    ほんのわずかな初期の要因の変化が最終的に思いがけないほど差のある結果を招く現象を「バタフライ効果」と呼びますが、そんな現象は身近なところでも起こっているのかもしれないと思わせるような、一見すると関係のない2つのデータに相関性を見いだすプロジェクトが「Spurious Correlations」です。 Spurious Correlations http://www.tylervigen.com/ 1999年~2009年までの「アメリカの科学・宇宙・テクノロジーに関する支出」と「首つり自殺数」の上昇傾向が一致。 「水泳プールでの溺死数」と「ニコラス・ケイジの映画出演数」が、なぜか似たような傾向で上下しています。つまり、ニコラス・ケイジが映画に出演しなければプールでの事故が激減するのかもしれません。 「アメリカ人1人あたりのチーズ消費量」と「ベッドシーツに絡まって死亡する数」がほぼ一致。 「ア

    「首つり自殺数」と「アメリカの科学・宇宙・テクノロジーに関する支出」など無関係のデータ同士で相関性をむりやり発見する「Spurious Correlations」 - GIGAZINE
  • 生化夜話 第47回 美しすぎる相関性が生んだ思い込み - 乳酸と筋肉疲労

    実績ある過去。そして新たな始まりへ。 GEヘルスケア ライフサイエンスはCytiva(サイティバ)となりました。『プレスリリース(英語)はこちらから』 まずは、ちょっとした頭の体操です。 観察された事実1:多量の物質Xが存在する場合、症状Yは重度である 観察された事実2:少量の物質Xしか存在しない場合、症状Yは軽度である 導かれる結論:Xを減らすことで症状Yを軽減することができる さて、この結論は正しいでしょうか? 正しいかもしれませんし、間違っているかもしれませんね。物質Xが症状Yの原因である可能性もありますが、それとは逆に症状Yの結果として生成されたのが物質Xである可能性もありますし、全く別の原因Zがあって、XとYはともにその結果かもしれないのです。 全貌が明らかになっていない系について、得られた相関性だけで解釈してしまうと、間違った結論に達してしまうことがあります。 しかし、それでも

    生化夜話 第47回 美しすぎる相関性が生んだ思い込み - 乳酸と筋肉疲労
    pongeponge
    pongeponge 2013/12/18
    乳酸悪者論は結構聞いたなぁ。確かテレビでも言ってた
  • スマホ使うほど読書時間減る傾向…読売世論調査 : 文化 : 社会 : YOMIURI ONLINE(読売新聞)

    読売新聞社の読書に関する全国世論調査(面接方式)で、スマートフォンを使う時間が長くなるほど、読書時間が減ったと答える人の割合が高くなる傾向がわかった。 スマホを通話以外のメールやインターネット、ゲームなどで使っていると答えた人(全体の28%)に、スマホを使うようになって読書時間が変わったかどうかを聞いたところ、「変わらない」が70%で最も多く、「減った」が17%、「増えた」が4%。「を読まない」は8%だった。 スマホを使う時間別にみると、1日平均30分未満の人では読書時間が「減った」人は10%だったが、30分~1時間未満では14%、1時間以上では27%となった。 また、直近の1か月間に1冊もを読まなかった人は全体の53%(昨年51%)で、2009年調査から5年連続で半数を超えた。を読まなかった人に理由を複数回答で聞くと、「時間がなかったから」が44%で最も多かった。この1年間に図書館

    pongeponge
    pongeponge 2013/10/20
    「本」を読む量は減ったけど「字」を読む量は爆発的に増えた気がする
  • 1