株式会社ブレインパッドの2023年新卒研修資料です。基礎統計学について扱っています。
このエントリーまとめ このエントリーでは、 性犯罪者にGPSを装着する政策は検討されていること。 データで見たところ性犯罪者の再犯率は高くなく、他の犯罪と同程度あること 政策に対して証拠をベースに考えるEBPMの紹介 を行う。 性犯罪 仮釈放中のGPS機器装着を義務化を検討。 www.nhk.or.jp 報道によると、政府は性犯罪者の仮釈放中のGPS危機装着義務化を検討している。 こちらのブックマークを見ても、性犯罪者は再犯率が高いので仕方ないという論調が目につく。 https://b.hatena.ne.jp/entry/s/www3.nhk.or.jp/news/html/20200611/k10012467301000.html 確かに、他の犯罪に比べて再犯する割合が高いのであれば、GPSの装着義務も仕方がないのかもしれない。しかし、下に述べるように性犯罪者の再犯率は他の犯罪と比較し
やっぱり現代の哲学者には数学、統計は欠かせないんだな みんな冷静に計算してほしいけど、東京都の新コロナ感染者数は現在171人。東京から無作為に200人をピックアップしたときに、その中に超有名人の志村けん氏が入ってる確率ってどのくらいだと思う? 現在の感染拡大ペースは我々の想像をはるかに超えてるよ。桁違いの感染者数になってるよ。— 森岡正博 (@Sukuitohananika) March 25, 2020 問い:「1000万人の人口からX人を無作為にピックアップしたときに、全員が知っているある有名人YがそのX人の集団に含まれていることが理にかなっているためには、Xは何人でなければならないか計算せよ。」このときのXが東京都の感染者数の推定となる。統計強い人よろしくお願いします。— 森岡正博 (@Sukuitohananika) March 25, 2020
新型コロナウイルス感染症(国内事例) 現在患者数 / 対策病床数 ※軽症者等は自宅療養など、病床を使用しないことがあります(詳細) (現在患者数 前日より増加 前日より減少) credit APP (アプリ開発/提供): CC BY jig.jp 福野泰介 @taisukef (src on GitHub) 「厚生労働省提供 新型コロナウイルス対策ダッシュボードについて」「感染者PDFデータをJSON-API化して公開」 DATA: CC BY「新型コロナウイルス感染症について - 厚生労働省」→ JSON / CSV / TXT (集約版 CSV / JSON / APP) DATA: CC BY COVID-19 Japan 新型コロナウイルス対策ダッシュボード JSON / CSV / TXT(厚生労働省、各都道府県公表データの集約) DATA: CC BY 「新型コロナウイルス患者
このニュース、放射線診断医師は憂鬱なtweetが目立っていた。 私も同様である。 その理由はベイズ推定にある。 あなたが感度99%、特異度99%のHIV検査を受けたと仮定する。 なんと陽性の結果であった。 血液1滴でがん検査… https://t.co/reQQBbGBvl
先日、twitter上で食べログの星の数について、 ある問題が話題になりました。 食べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 食べログは飲食店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲食店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「食べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 食べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、食
このページをご覧頂き、ありがとうございます。 「ベイズと最尤のどちらが正しいのか」と、いつも何度でも尋ねられます。 「事前分布は何が正しいのか」と、いつも何度でも尋ねられます。 ここでは、できるだけ短く、その質問についての返答を述べます。 1.正しい統計的推論は存在しない 統計学が扱う問題では、ほとんどの場合、基礎となる確率がわからないので、 特別な場合を除いて、正しいモデル・正しい事前分布・正しい推論というものは存在しません。 条件が不足したり過剰だったりして答えられない問題のことを【不良設定問題】と いいます。 統計学は不良設定問題を扱う学問です。 この世にあるほとんどの問題は程度の違いこそあれ、みな不良設定です。 まずは「統計学は不良設定問題を扱う学問である」ということを理解しましょう。 基礎となる確率が定められていなければ【正しい統計的推論】は存在しません。 (注) 基礎となる確率
このとき、測定値の標本平均は$$\bar{T}=\frac{1}{N}\sum_iT_i=2.00\,\text{s}$$、標本不偏分散は$$s^2=\frac{1}{N-1}\sum_i(T_i-\bar{T})^2=1\times10^{-3}\,\text{s}^2$$、標準不確かさ6をタイプA評価すると、$$\frac{s}{\sqrt{N}}=1\times10^{-2}\,\text{s}$$である(ただし以下$N=10$)。学生がこの実験レポートを書くとき、こう記述することになるだろう。 $$T=2.00(1)\,\text{s}$$ 数理モデルの世界 このとき、次のような数理モデルを考える。 仮定0 :$x_1,\dots,x_N$は平均$\mu$の独立同分布に従う確率変数の実現値である。 仮定1 :$x_1,\dots,x_N$が従う分布は正規分布である。 仮定2 :$N
黒木玄 Gen Kuroki @genkuroki #数楽 ベイズ統計の解説の仕方について考えてみた。事前分布も不可欠な「モデル」の構成要素とする解説の仕方。 ベイズ統計では、現実世界における未知の確率分布(場合によっては永久に未知のまま)によるサンプルX_1,X2,…の生成の仕方を次の「モデル」で推定しようとする。続く 2016-10-29 00:26:56 黒木玄 Gen Kuroki @genkuroki #数楽 続き。パラメーターw付きのxの確率分布p(x|w)とwの確率分布φ(w)を選択。「モデル」の世界でサンプルは次のように生成されると考える。まずパラメーターwが分布φ(w)にしたがってランダムに生成され、wで決まるxの分布p(x|w)の独立試行でサンプルが生成される。続く 2016-10-29 00:32:51 黒木玄 Gen Kuroki @genkuroki #数楽 続き
部屋とYシャツと構造と力と私、こと林岳彦です。こんにちは。本ブログではお久しぶりです。 先週末に、社会学系の研究会からの依頼で、(1)因果推論の諸理論が奥の方でどう繋がっているか、(2)その"奥の方"で「質的理解」と「量的分析」がどう繋がっているか、をテーマに講演いたしました。その資料をアップロードしましたのでご報告いたします。 因果推論の奥へ: "What works" meets "why it works" from takehikoihayashi ついでに6月に佐賀大で行った、「生態学者における統計的因果推論の導入」についての講演資料も(以前に)アップしておりましたのでご報告いたします。 「生態学における統計的因果推論」という大ネタへの挑戦:その理論的背景と適用事例 from takehikoihayashi 現在わたくしは「筆頭著者論文を書かない」という非行の更生のため同僚の保
社会心理学者の山岡重行氏の『腐女子の心理学2』の巻末の統計学用語の説明に関して、社会学者の北田暁大氏が色々と批判している*1。しかし、あれこれ経緯がある*2からだと思うが、全般的に勇み足になっているので指摘しておきたい。山岡氏の記述にも問題が無いとは言い切れないのだが、統計学を学んでいない人向けの説明であろうことを念頭に置くと、山岡氏が統計学に無理解であるかのような批判は適切ではないと思われる。 1. P値の解釈について 北田氏は、山岡氏のように統計的仮説検定で「事実認定」をすることは、アメリカ統計学会(ASA)の声明*3に合致しないと主張しているのだが、何を「事実認定」するのかについて注意が払われていない不適切な批判になっている。 山岡氏の説明では、分類したグループ間の平均値に差があるのか「事実認定」するために、統計的仮説検定を用いることになっている(pp.72–73)。つまり、データと
現在位置: carview! > ニュース > 業界ニュース > 高齢ドライバーの事故が急増というウソ。統計データでは高齢者の起こす死亡事故は激減している ■85歳以上のドライバーが死亡事故を起こす確率は高いが、前年比では28.6%も減っている 高齢ドライバーの運転ミスに起因する交通事故が急増している……昨今のメディア報道からそんな風に思ってはいないだろうか。たしかに、80歳を超える高齢ドライバーは明らかに事故を起こしやすいという統計データがあるのは有名な話だ。では、最新データでも高齢ドライバーの交通事故は増えているのか、警察庁が発表している『交通事故統計月報』の最新バージョンである令和元年5月末版でのデータから確認してみると、報道のイメージとはまったく異なる数字が見えてくる。 イギリスの保険サービス会社が車名別の事故率を調査、トップはプリウスだった 結論からいえば、交通死亡事故についてい
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く