並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 422件

新着順 人気順

信頼区間の検索結果1 - 40 件 / 422件

  • 事実に誠意を

    これから書くことはほとんど、これまでも繰り返し申し上げてきたことと変わりない。が、同じ質問は繰り返し受けているので、再度申し上げる次第である。なお、海外からも同様の問い合わせが多いので本来であれば英語でも同じ内容の文章を用意すべきだが、時間の関係で割愛させてください。Chromeかなにかでそれぞれ母国語に訳してお読みいただけると幸いです。なお、本稿は特に感染症学の基礎知識やジャーゴンを知らなくても読めるように工夫はしているが、それなりに難解な内容だ。その点はご容赦いただきたい。 日本のCOVID-19報告数が諸外国に比べて非常に少ないことに内外から注目が集まっている。あれは本当なのか。検査数が少なすぎて、実際の感染者数を見誤っているのではないか、という指摘がある。 しかし、この指摘はいろいろなレイヤーにおいて間違っている。そもそも、日本はCOVID-19の全数把握を目指していない。行政検査

      事実に誠意を
    • 総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門

      統計データを用いた分析事例を知り、 統計リテラシーを学ぶ ・大人がデータサイエンスを学ぶべき理由 ・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性 ・統計を利用する際の注意点 データ分析に必要な統計学の基礎を学ぶ ・データの種類 ・代表値~平均・中央・最頻値 ・ヒストグラムと相対度数 ・四分位・パーセンタイル・箱ひげ図 ・分散・標準偏差 ・相関関係 ・回帰分析 ・標本分布 ・信頼区間 データの見方と 適切なグラフの選び方を学ぶ ・統計表の見方 ・比率の見方①-クロスセクションデータ- ・比率の見方②-使い方と注意点- ・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点 誰もが使える公的統計データの取得方法と 使い方を学ぶ ・公的統計とは ・公的データの入手

        総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門
      • なぜ日本はまあまあ防疫できているのか(私的仮説まとめ)|ショーンKY

        もう一つ注目しておきたいのは、感染力のピークが発症直前の無症候の段階で訪れるという推定である。このHeらの研究では、発症前に感染が起きた割合は44% (95%信頼区間25–69%) に達するとしている。 そもそも病院に訪れないであろう無症候者・軽症者が大量におり、その上病院に行く者ですら感染の半分は病院に行く前に終わっているのだとすれば、陽性者を隔離するというストラテジーだけでは感染拡大を防げないことになる。PCR検査の1回の感度が7割程度という過去の知見(例1、例2、例3)と合わせれば、「病院に来た感冒症状患者全員にPCR検査し、陽性者を隔離する」という戦略で防げる感染は甘く見ても3割程度、厳しめに見れば1~2割程度となり、大半の感染を素通ししてしまうことになる。 あえて検査→隔離戦略一本で解決しようとするならば、発症前でも検出できるよう、PCR検査とは全く違うレベルの検査――皆が毎朝自

          なぜ日本はまあまあ防疫できているのか(私的仮説まとめ)|ショーンKY
        • WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times

          主な確率分布の関連図 こんにちは、吉岡(@yoshiokatsuneo)です。 Webサービスを運営していると、利用状況を分析・予測したり、A/Bテストなどで検証したりすることがよくあります。 データを一個一個見ていてもよくわからないので、データ全体や、その背景の傾向などがまとめて見られると便利ですよね。そんなとき、データの様子を表現するためによく使われているのが「確率分布」です。 学校の試験などで使われる偏差値も、得点を正規分布でモデル化して、点数を変換したものです。 今回は、Webサービスなどでよく使われる確率分布18種類を紹介します。 それぞれ、Webサービスでの利用例やPythonでグラフを書く方法も含めて説明していきます。コードは実際にオンライン実行環境paiza.IOで実行してみることができますので、ぜひ試してみてください。 【目次】 正規分布 対数正規分布 離散一様分布 連続

            WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times
          • 新型コロナウイルス感染症対策専門家会議 「新型コロナウイルス感染症対策の状況分析・提言」(2020 年 3 月 19 日)

            1 新型コロナウイルス感染症対策専門家会議 「新型コロナウイルス感染症対策の状況分析・提言」 (2020 年 3 月 19 日) 本専門家会議は、政府の新型コロナウイルス感染症対策本部の下、新型コロナウイルス 感染症の対策について医学的な見地から助言等を行うために設置されました(令和2年 2 月 14 日 新型コロナウイルス感染症対策本部決定) 。この見解は、新型コロナウイルス厚 生労働省対策本部クラスター対策班が分析した内容等に基づき、専門家会議において検討 した結果をまとめています。 現在までに明らかになってきた情報をもとに、現状の状況分析を行い、その正確な情報 提供に努めるとともに、政府及び自治体に対し提言を、国民の皆様及び事業者の方々に対 しお願いをすることとしています。 分析結果等はあくまでも現時点のものであり、随時、変更される可能性があります。 Ⅰ.はじめに 新型コロナウイルス

            • 統計検定準1級に合格した話 - i5882353iの日記

              2022年4月13日の試験で統計検定準1級に合格したので、記事を書く気になりました。daminです。(Twitter: @5882353i) うおおおおおおお統計検定準1級合格!!!!!!!うおおおおおおお!!!おおおおおお!!!!!!うおおおおおお!!!!!!!!!!!!!!! pic.twitter.com/J1LDsgUVm1 — 惰眠👻 (@5882353i) 2022年4月13日 背景や、合格するまでに使った本などを書いていきます。 背景(受験までのおおまかな流れなど) 余談:センター統計選択のススメ 持っていた方がよいもの・知識 線形代数の知識 Pythonの知識 goodnotes5 使った本 東大出版の統計学入門(通称:赤い本) 公式の準1級対策本(通称:ワークブック) 過去問 クラインバウム生存時間解析 ゼロDL ベイズ漫画 まとめ 真剣に読んでいる人向けのまとめ あま

                統計検定準1級に合格した話 - i5882353iの日記
              • 「1日1万歩で健康」説はやっぱり本当? 歩数や座位時間と死亡率の関係を調査、7万人を対象に【研究紹介】

                オーストラリアのシドニー大学などに所属する研究者らが発表した論文「Do the associations of daily steps with mortality and incident cardiovascular disease differ by sedentary time levels? A device-based cohort study」は、1日の歩数と、全死因死亡率およびCVD(心血管疾患)発症率の関連性を調査した研究報告である。 この研究は、UKバイオバンク(英国)の参加者を対象に実施。対象となった参加者7万2,174人(平均年齢61.1、女性57.9%)は、24時間7日間にわたって加速度計を装着し、1日の歩数と座位時間の測定を受けた。追跡期間(平均6.9年)中に1,633人が死亡し、6,190人がCVDを発症した。 keyboard_arrow_down 研究内容

                  「1日1万歩で健康」説はやっぱり本当? 歩数や座位時間と死亡率の関係を調査、7万人を対象に【研究紹介】
                • ゲームプレーヤーを精神疾患にするディストピア――久里浜医療センター「ゲーム障害の有病率5.1%」論文のからくり/井出草平 - SYNODOS

                  ゲームプレーヤーを精神疾患にするディストピア――久里浜医療センター「ゲーム障害の有病率5.1%」論文のからくり 井出草平 社会学 社会 エグゼクティブ・サマリ 久里浜医療センターの樋口進氏らのグループが発表した論文から、ゲーム障害を過剰診断していく方針が読み取れる。この論文は厚労省・文科省の政策にも影響があると考えられ、ゲーム好きの健康な子どもや若者たちが、精神疾患とレッテルを貼られ精神科病棟に入れられる未来も現実味を帯びてきた。 先日、ゲーム障害の有病率調査が久里浜医療センターによって発表された。【注1】英語論文として発表されたため、まだ一般には知られていないが、専門家の間ではかなり話題になっている。というのも、久里浜医療センターはゲーム障害でない人を診断しようとしているのではないか、と、いわゆる過剰診断を懸念する声が湧き上がっているからである。 本稿では、久里浜医療センターの研究を紹介

                    ゲームプレーヤーを精神疾患にするディストピア――久里浜医療センター「ゲーム障害の有病率5.1%」論文のからくり/井出草平 - SYNODOS
                  • 統計検定1級(2021)を受験した話(統計数理の試験対策・勉強編) - 統計応用合格君’s diary

                    この記事は何? タイトルの通り、2021年の統計検定1級試験を受験し統計数理に合格してきたので、記憶が鮮明なうちに勉強してきた内容をメモしておこうと思います。ちなみに、統計検定は私にとって今回が(級によらず)初めての受験でした。 対策・勉強した内容以外の、当日の受験体験記は以前に公開していますので、そちらもご興味あればぜひ併せてご覧ください。 taro-masuda.hatenablog.com 免責 あくまで個人的な方法論であるため、本記事の情報が必ずしも今後の試験においてそのまま有効であるとは限りませんのでご注意ください。損失等をこうむられた場合であっても、筆者は一切の責任を負いかねます。 TL;DR 久保川先生の教科書『現代数理統計学の基礎』の2~8章の章末問題((*)印は飛ばす) + 統計数理は過去問を仕上げました。過去問は1ヶ月以上前からやるのがお勧めです。 現代数理統計学の基礎

                      統計検定1級(2021)を受験した話(統計数理の試験対策・勉強編) - 統計応用合格君’s diary
                    • 2023年版:実務データ分析を手掛けるデータサイエンティスト向け推薦書籍リスト(初級6冊+中級8冊+テーマ別15冊) - 渋谷駅前で働くデータサイエンティストのブログ

                      (Image by wal_172619 from Pixabay) 去年で恒例の推薦書籍リストの更新は一旦終了したつもりだったんですが、記事を公開して以降に「これは新たにリスト入りさせないわけにはいかない!」という書籍が幾つも現れる事態になりましたので、前言撤回して今年も推薦書籍リストを公開しようと思います。 初級向け6冊 実務総論 データサイエンス総論 R・Pythonによるデータ分析プログラミング 統計学 機械学習 中級向け8冊 統計学 機械学習 テーマ別15冊 回帰モデル PRML 機械学習の実践 Deep Learning / NN 統計的因果推論 ベイズ統計学 時系列分析 グラフ・ネットワーク分析 データ基盤 コメントや補足説明など 完全なる余談 初級向け6冊 今回は新たに加わったテキストがあります。 実務総論 AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出

                        2023年版:実務データ分析を手掛けるデータサイエンティスト向け推薦書籍リスト(初級6冊+中級8冊+テーマ別15冊) - 渋谷駅前で働くデータサイエンティストのブログ
                      • 京都大学、因果推論の手法と理論を学べる講座が無料に 臨床統計学の講師が担当 | Ledge.ai

                        画像は「京都大学「因果推論 -一般化線型モデルとRubin因果モデルの理論-」講座PV~ gacco:無料で学べる大学講座」より オンライン講座サイト「gacco(ガッコ)」では、オンライン講座「因果推論 -一般化線型モデルとRubin因果モデルの理論-」を開講中だ。京都大学が大学院生向けに提供する臨床統計家育成コースを過去の教育経験をベースに、臨床医学のための統計学を習得できるように構成したもの。閉講日時は2022年2月28日(月)23時59分。受講料は無料。 本講座では、医学のための因果推論(causal inference)の手法とその理論を解説する。因果推論の理論を系統的にまとめた「講義ノート」が用意され、いくつかの重要な論点を対話形式で解説した動画を視聴して学習する。 因果推論を学ばなければならない理由の1つとして、医学、経済学、政治学、教育学といった分野で、実証研究の価値が高ま

                          京都大学、因果推論の手法と理論を学べる講座が無料に 臨床統計学の講師が担当 | Ledge.ai
                        • 世界で74万人以上が受講した海外講座を“日本語で”学ぼう! Udemyで初夏のビッグセール開催&大人気講座をチェック - はてなニュース

                          多くの企業から「人手不足だ」という話が聞こえてきます。なんでも、新しいビジネスを始めようとしたり、新規サービスを立ち上げようとしたり、はたまた事業規模を拡大したり、ということで人材を募集しても、なかなか集まらないんだとか。それも、大企業からスタートアップまで、会社の規模の大小や領域に限らず、ありとあらゆる分野の企業が当てはまっています。 特にIT業界は、ただでさえ業界全体が成長しているうえに、技術の進歩と陳腐化が激しいため、基礎的な技術や知識を持ちながら、新たな情報やトレンドもフォローしているようなエンジニアは、引く手あまた。さらに最近では、エンジニアでなくてもビジネス分野で活躍するためには、データを扱うことができる高度な知識と経験が求められるケースが増えてきていることもあって、人手不足に拍車が掛かっているのだそうです。 そんな社会の中で、自分を成長させ、新たな分野に踏み出していくためには

                            世界で74万人以上が受講した海外講座を“日本語で”学ぼう! Udemyで初夏のビッグセール開催&大人気講座をチェック - はてなニュース
                          • 実務の専門家として機械学習や統計分析を手掛けたい人にオススメの書籍初級5冊&中級8冊+テーマ別11冊(2020年2月版) - 渋谷駅前で働くデータサイエンティストのブログ

                            (Image by Pixabay) この記事は以下のオススメ書籍リスト記事のアップデートです。 毎回の断り書きで恐縮ですが、この記事では「データサイエンティストや機械学習エンジニアなどデータ分析の実務の専門家として」*1機械学習や統計分析を手掛けていきたいという、主に初級ないし中級ぐらいのスキルレベルの人たちにお薦めしたい書籍を、初級向け5冊・中級向け8冊及び細かいテーマ別に11冊、それぞれ挙げていきます。スタンスとしては相変わらず「当座の最終到達点を『中級』に置いた時に最初に読んで内容をマスターしておくべき書籍」を初級に置いているので、世の中のこの手のお薦め書籍リストに比べると若干ハードな内容のものが初級向けに多いかもしれません。 後はちょっと気が早いかもしれませんが、機械学習パートに関しては「AutoML時代にあっても実務の専門家であれば知っておくべき知識」を収めた書籍を選んでおきま

                              実務の専門家として機械学習や統計分析を手掛けたい人にオススメの書籍初級5冊&中級8冊+テーマ別11冊(2020年2月版) - 渋谷駅前で働くデータサイエンティストのブログ
                            • 『標準ベイズ統計学』はベイズ統計学をきちんと基礎から日本語で学びたいという人にとって必携の一冊 - 渋谷駅前で働くデータサイエンティストのブログ

                              標準 ベイズ統計学 朝倉書店Amazon 発刊当時に話題になっていた『標準ベイズ統計学』。実は訳者のお一人、菅澤翔之助さんからオフィス宛てでご恵贈いただいていたのですが、親父の没後処理やら自分のDVTやら実家の片付けやらで全く手が回らずオフィスに置いたままにしてしまっていたのでした。で、この度改めて拝読してみたら「何故もっと早く読まなかったんだ」と後悔するくらいあまりにも内容が素晴らしかったので、遅まきながら書評記事を書こうと思い立った次第です。 ベイズ統計学というと、殆ど詳しくない人だと「ベイズの定理以外に何があるの?」という印象ぐらいしかないかもしれませんし、一方でとりあえず技法としてやり方だけ覚えてしまった人だと「とりあえずMCMC回せばいいんだよね?」みたいな雑な理解になってしまうかもしれません。いずれにせよこれまで邦書ではベイズ統計学というと超初歩か実装重視かの二択が多かったせい

                                『標準ベイズ統計学』はベイズ統計学をきちんと基礎から日本語で学びたいという人にとって必携の一冊 - 渋谷駅前で働くデータサイエンティストのブログ
                              • 慶応のPCR6%の意味

                                慶応大学病院が無症状の患者67人に新型コロナウイルスSARS-CoV-2のPCRを行い、4名が陽性であったと発表した。6%である。 これだとnが少ないのでシンプルな二項検定を行うと、95%信頼区間は 1.7%-14.6%となる。東京都民の1395万人に当てはめると 237,150人-2,036,700人となる。今朝(4月23日)見た、PCRで陽性になった感染者の累計が3,439人だから、実際の感染者はPCRで把握されている患者の69-592倍いる、ということになる(追記。これは観察期間が違うので不適切な分数でした、すみません。実際はもっと大きな数になります。慶応の検査実施期間が報道では分からなかったので適切な計算は今できませんが、要するに「分かってるよりずっとずっとたくさん」ということだ)。 PCRの感度は30-70%くらいと考えられるから、楽観的シナリオだと真の感染者は4/0.7=約6人

                                • 基礎から学ぶ統計学

                                  本章では、二項検定を学びます。二項検定は、本書で学ぶ統計手法の中では、最も使用頻度が低い手法です。しかし、統計学の入門に最適な学習項目です。理由が3つあります。第一に、高校1~2年で学んだ数学だけで、この手法の原理を完全に理解できます。統計手法はたくさんありますが、唯一この手法だけは、全て手作りの計算で実行できます。第二に、面倒な検定統計量の計算を必要としません。第三に、二項検定には、検定の論理の全てが詰まっています。こうした理由から、読者のお父さんやお母さん、もしくは、お爺ちゃんやお婆ちゃんの世代では、二項検定は、高校の数学の教科書で解説されていました。この「とても分かりやすい」という長所を、活用しない手はありません。本書では、統計学の学習を、二項検定から始めます。本章では、当時の大学入試の頻出問題をさらに簡単にした例題を使って、学びます。… 本書の使い方 統計学を学ぶ心がけ/予備知識/

                                    基礎から学ぶ統計学
                                  • 社会人のためのデータサイエンス入門

                                    この度、「社会人のためのデータサイエンス入門」の開講に先立ち、「誰でも使える統計オープンデータ」を特別開講しております。 入門編と学習することで、統計の基礎やデータの見方・データの取得方法などを学べます。この機会にぜひ2講座併せてご受講ください。 ※「《特別開講》誰でも使える統計オープンデータ」は、修了証の発行はございません。 講座内容 今、ビジネスの現場では、統計的な思考力によって様々な課題を解決していく能力、すなわち"データサイエンス"力の高い人材が求められている。このようなことを踏まえ、本コースでは"データサイエンス"力の向上を目指し、事例なども踏まえ、データ分析の基本的な知識を学ぶ。 コースは4つの部分に分かれている。第1週では、社会でデータがどのように活用されているかについて、実際のデータを用いた分析事例を紹介する。第2週では、データを理解し、分析する際に必要な統計学の基礎につい

                                      社会人のためのデータサイエンス入門
                                    • 《特別開講》社会人のためのデータサイエンス入門

                                      2020年9月29日開講予定の「社会人のためのデータサイエンス演習」にさきがけて、「社会人のためのデータサイエンス入門」を特別開講いたします。 入門編と演習(実践編)を受講することで、データ分析の基本的な知識から、ビジネスの現場で使われる実践的なデータ分析(統計分析)の手法までを身につけることができます。 「社会人のためのデータサイエンス演習」はこちらのページをご参照ください。 講座内容 今、ビジネスの現場では、統計的な思考力によって様々な課題を解決していく能力、すなわち"データサイエンス"力の高い人材が求められている。このようなことを踏まえ、本コースでは"データサイエンス"力の向上を目指し、事例なども踏まえ、データ分析の基本的な知識を学ぶ。 コースは4つの部分に分かれている。第1週では、社会でデータがどのように活用されているかについて、実際のデータを用いた分析事例を紹介する。第2週では、

                                        《特別開講》社会人のためのデータサイエンス入門
                                      • COVID-19 日本国内の潜在的な陽性者数を推定する試み - StatModeling Memorandum

                                        日本国内の潜在的な陽性者数を推定することは有益ですが、簡単ではありません。PCR検査がランダムになっていないことが推定を難しくしています。有症状者が検査されやすいというselection biasがあるからです。この記事ではいくつか仮定を置いて潜在的な陽性者数を推定したいと思います。 仮定 全国民のうち潜在的に陽性になっている割合 この割合は年代によらず一定と仮定します。ここでは と書きます(posはpositiveの略)。例えば0.0001なら日本人約1億2千万人中、おおよそ12000人が潜在的に陽性になっている計算です。 なお、国民の年代別人口の値はこのページの令和2年3月報 (令和元年10月確定値,令和2年3月概算値) (PDF:301KB) の「2019年10月1日現在(確定値)」の総人口 男女計の値を使用しました。 陽性者中の有症状者の割合 若年層で無症状が多いなど、年代で異なる

                                          COVID-19 日本国内の潜在的な陽性者数を推定する試み - StatModeling Memorandum
                                        • ワクチンが開発されても、ウイルスは根絶されない(高山義浩) - エキスパート - Yahoo!ニュース

                                          厚生労働省は、6月16日、3都府県で実施していた新型コロナウイルス抗体検査の結果を発表しました。東京都では1971人中2人(0.10%)、大阪府では2970人中5人(0.17%)、宮城県では3009人中1人(0.03%)が抗体陽性と判定されたとのこと。 ただし、使用した検査キットによって判定に違いがありましたし、この結果が、どれくらい「過去の感染」を反映しているかは不明ですね。抗体の持続期間(もっと正確に言うと、検査で陽性となるだけの血中濃度を維持する期間)が短ければ、当然、結果はバラつくことでしょう。分かったのは、抗体陽性者の数であって、感染者数ではないという当然の理解が必要です。 また、母集団に対する陽性者数が少なすぎるため、単純に人口に乗じて感染者数を導くようなことをしてはいけません。そういう基本的な理解のない報道があまりにも多くて仰天しました。 たとえば、東京都の陽性者数は2人でし

                                            ワクチンが開発されても、ウイルスは根絶されない(高山義浩) - エキスパート - Yahoo!ニュース
                                          • 統計学の素人がGoToトラベル論文を斜め読みする(追記あり)

                                            2021/01/29追記:西浦氏から解説記事が上がったのでこちら読んだ上での追記も適宜行ってる。 m3.com/open/iryoIshin/article/873130/ 翻訳ミスってたので修正。指摘ブコメ感謝です。 https://www3.nhk.or.jp/news/html/20210125/k10012831381000.html この記事のブコメでみんな疑問に思ってるっぽいので、素人でもわかる範囲のことを書いてみた。 この論文は何を書いてるの? 何をしてるの?https://www.mdpi.com/2077-0383/10/3/398/htm 2020年7月22日のGoToトラベルキャンペーン開始と新型コロナウイルスとの疫学的影響の可能性について調べて見たっぽい。 ファーストオーサーが安齋麻美さん(修士か博士のどちらか)で西浦博教授も著者に含まれる。北海道大学の衛生学研究室

                                              統計学の素人がGoToトラベル論文を斜め読みする(追記あり)
                                            • Python ユーザでも『データ可視化入門』で練習できるようにパッケージを作った + Plotnine との互換性ガイド - ill-identified diary

                                              概要 pysocviz が提供する機能 ggplot2 と同じようにできないところとその対策 aes() にクオートされてない変数を指定できない R のように改行できない ggplot2 で使えた色名が使えない ggplot2 で使えた linetype が使えない 文字化けの回避 ggrepel パッケージの利用 scales::percent などの単位・スケール指定 テーマや色パレットのプリセットを変更したい場合 subtitle/caption が表示されない 複数のグラフを連結できない hjust/vjust が使えない グラフ内の図形やテキストの大きさのバランスがおかしい geom_smooth/stat_smooth で一般化加法モデル (GAM) による平滑化ができない geom_quantile の method 指定ができない geom_smooth/stat_smoo

                                                Python ユーザでも『データ可視化入門』で練習できるようにパッケージを作った + Plotnine との互換性ガイド - ill-identified diary
                                              • マニフェスト選挙を疑え:2021年総選挙の計量政治学

                                                マニフェストと言えば、総選挙(衆院議員選挙)。総選挙と言えば、マニフェスト。各政党が作成し、選挙の前に配布する政権公約集のことである。この用語は、有権者の間で広く一般的に認知されるようになってきていると思われる。しかし、マニフェストは日本の政治をより良くすることに役立っているのだろうか。選挙の結果は、各党が作成するマニフェストに対する支持・不支持を反映しているのだろうか。 マニフェスト選挙18年、続く自民党の圧勝 マニフェストの起源は19世紀における英国の総選挙とされているが、日本の総選挙で各政党が初めてマニフェストを作成・配布したのは、18年前の2003年11月である。2003年10月の改正以前の公職選挙法では、枚数、サイズなど厳密に規定されたビラ以外、政党が政策資料を作成して頒布することすら禁止されていたのである。 それから18年。マニフェスト選挙元年に生まれた赤ちゃんの多くは、今年1

                                                  マニフェスト選挙を疑え:2021年総選挙の計量政治学
                                                • 《特別開講》社会人のためのデータサイエンス入門

                                                  2021年1月12日開講予定の「誰でも使える統計オープンデータ」にさきがけて、「社会人のためのデータサイエンス入門」を特別開講いたします。 本講座では入門編として、統計学の基礎やデータの見方・データの取得方法などを学べます。統計学の基礎を学ぶことにより、活用編である「誰でも使える統計オープンデータ」もより効果的に受講することができますので、この機会にぜひ2講座併せてご受講ください。 「誰でも使える統計オープンデータ」はこちらのページをご参照ください。 講座内容 今、ビジネスの現場では、統計的な思考力によって様々な課題を解決していく能力、すなわち"データサイエンス"力の高い人材が求められている。このようなことを踏まえ、本コースでは"データサイエンス"力の向上を目指し、事例なども踏まえ、データ分析の基本的な知識を学ぶ。 コースは4つの部分に分かれている。第1週では、社会でデータがどのように活用

                                                    《特別開講》社会人のためのデータサイエンス入門
                                                  • ソーシャルゲームにおけるキャラクターの露出度の性差の検討:『Fate/ Grand Order』を例に : 九段新報

                                                    (今回の記事はいつもと文体が違います。それは『「フェミニスト共感ランキング」にみる「数字っぽいもの」への狂信、あるいは具体と抽象の往復に対する困難』でも指摘した通り、近年noteなどを主要な領域として調査もどきとでも言うべきものが流通しており、そうした調査の基礎をおろそかにした議論に否定的な一石を投じるためです。簡単に言い換えれば、もし本職がこの手の調査を徹頭徹尾論文っぽくやったらどうなるかをシミュレーションすることで、調査もどきのいい加減さを浮き彫りにしようということです。) 目的 近年、表現におけるジェンダーバイアスやその影響に関する議論が注目されている。特に創作物に登場するキャラクターの衣装の露出度に関しては性別による著しい差異が指摘されている(e.g. 東京新聞, 2022)。 しかしながら、創作物やそこに登場するキャラクターの数は膨大であり、多くのキャラクターの露出度を計量的に検

                                                      ソーシャルゲームにおけるキャラクターの露出度の性差の検討:『Fate/ Grand Order』を例に : 九段新報
                                                    • おかしな議論にごまかされないための『論証のルールブック』

                                                      『論証のルールブック』は、簡潔で説得力のある文章を書くためのルールが、50にまとめられている。1つのルールに1つの例文、1つの解説という構成で、この本そのものが簡潔さを目指している。 ごく基本的な常識レベルのものから、見落としがちな盲点まで、まんべんなく網羅されているのがいい。いくつか紹介する。 主張には根拠が必要だ 数字は他のエビデンスと同じような検証が必要だ 長文の論証や、口頭で伝える際、サインポストを活用する 論点先取の見抜き方 「主張には根拠が必要だ」なんて、当たり前すぎて、なにを今さらと感じるかもしれない。確かにその通りだろう。だが、実際に、事実のフリをした意見や、根拠レスの主張に出会ったとき、即座に見抜けるだろうか。 たとえば、この主張なんてどうだろう。 聖書に神は存在すると書かれているから、神は存在する 聖書は神が書かれたのだから、正しい これは、結論が前提に含まれた有名な例

                                                        おかしな議論にごまかされないための『論証のルールブック』
                                                      • 国立感染症研究所が「東京のインフルエンザ死亡数が激増」と発表、新型コロナとの関連性で物議に (2020年4月1日) - エキサイトニュース

                                                        イメージ画像/出典:Hamatti 国立感染症研究所が3月31日に発表した「21大都市インフルエンザ・肺炎死亡報告」で東京の死亡者数が急増し、物議を醸している。 このデータでは、なぜインフルエンザ・肺炎死亡者数が急増しているのかは明らかにされていないため、「新型コロナウイルスの関連死が含まれているのではないか」との疑問が持たれている。 以下の図は21大都市合計だが、これを見ると実際の死亡数が10週から11週にかけて跳ね上がっていることがわかる。ただ、その数値はベースラインや閾値(いきち)を大きく下回っている。また、解説文にあるように、「超過死亡はありません」となっている。 https://www.niid.go.jp/niid/ja/flu-m/2112-idsc/jinsoku/1847-flu-jinsoku-2.html では、ベースラインや閾値、超過死亡とは何を示すのか? インフル

                                                          国立感染症研究所が「東京のインフルエンザ死亡数が激増」と発表、新型コロナとの関連性で物議に (2020年4月1日) - エキサイトニュース
                                                        • Web系企業での一人目の機械学習エンジニア・データサイエンティストに必要なスキルと経験して思ったこと - Qiita

                                                          0、はじめに マッチングアプリで機械学習エンジニアをやっているはやとと言います。今回は「Web系企業での一人目の機械学習エンジニア・データサイエンティストに必要なもの、やって感じたこと」について書いていこうと思います。 「Web系企業で機械学習エンジニアやってみたい!」「組織としてデータ分析や機械学習をやり始めたいけど何からやったらいいかわからない!」という方も多くいるでしょう。 Web系企業での機械学習エンジニア・データサイエンティストの動きはメルカリのブログとか本でよく見ます。しかし、まだ規模があまり大きくない会社における機械学習エンジニア・データサイエンティストの記事や本は一切見当たらず、また、立ち上げ(そんな大げさな言葉を使っていいのか分かりませんがw)の話が書いてあるものは見たことがないです。そのため、もしかしたら日本で初めての記事になるのではないかなと考えてワクワクしながら書い

                                                            Web系企業での一人目の機械学習エンジニア・データサイエンティストに必要なスキルと経験して思ったこと - Qiita
                                                          • 機械学習アルゴリズムの学習法

                                                            TL;DR 機械学習のアルゴリズムには詳しくなりたいけど実装はしない、という立場の人向けの学習資料まとめ 知人向けで、具体的には同僚医師がターゲット読者(めちゃ狭い!)だが、一定度他の人にも役に立つかも 改めて色々眺めてみてやっぱり大学の講義は質の高いものが多いと思った 知人が機械学習のアルゴリズムを学びたいと言っているので、オススメの資料などを見繕ってみるブログエントリ。 機械学習への関わり方を雑にアルゴリズムと実装で分けた場合に、アルゴリズムには詳しくなりたいけど実装をするわけではない、という立場の人向けである。 このようなタイプの人はそんなにいないと思うけど、具体的にはドメインエキスパートとして機械学習エンジニアと一緒にアルゴリズム・データ改善に取り組んでいて、アルゴリズムでどんなことをやっているかをちゃんと理解したい、みたいなのが一例となる。 なんとなくのイメージ的な理解だけだと、

                                                              機械学習アルゴリズムの学習法
                                                            • 2024年版:独断と偏見で選ぶ、データ分析職の方々にお薦めしたいホットトピックス&定番の書籍リスト - 渋谷駅前で働くデータサイエンティストのブログ

                                                              毎年四の五の言いながら書いている推薦書籍リスト記事ですが、何だかんだで今年も書くことにしました。なお昨年度版の記事を上にリンクしておきましたので、以前のバージョンを読まれたい方はそちらをお読みください。 今回のバージョンでは、趣向をちょっと変えて「定番」と「注目分野」というように分けました。何故こうしたかというと、平たく言って 「初級&中級向け」推薦書籍リストは定番化していて毎年あまり変更点がない 逆に直近のホットトピックスに関するテキストは毎年入れ替わりが激し過ぎて網羅しづらい という課題があり、特に2点目についてはあまりにもデータサイエンス関連書籍の新規刊行が多過ぎる&僕自身がその流れについていけておらず完全に浦島太郎状態ですので、万人向けに等しくウケるようなリストを作るのは今回をもって完全に諦めたというのが実態です。 その上で、前回まで踏襲されていた定番書籍リストはバルクで提示すると

                                                                2024年版:独断と偏見で選ぶ、データ分析職の方々にお薦めしたいホットトピックス&定番の書籍リスト - 渋谷駅前で働くデータサイエンティストのブログ
                                                              • インフルエンザ報告数 例年累計患者数500万人→今年1万人以下 ※ - 斗比主閲子の姑日記

                                                                定点観測している厚労省によるインフルエンザ報告数です。 インフルエンザに関する報道発表資料 |厚生労働省 ですが、 2021年1月22日 インフルエンザの発生状況について 定点医療機関からの報告をもとに、定点以外を含む全国の医療機関をこの 1 週間に受診した患者数を推計すると約0.1 万人(95%信頼区間:0~0.1 万人)となり、前週の推計値(約 0.1 万人)と同程度であった。千人単位での推計となることから、年齢別での推計値については記載を省略する。また、2020 年第 36 週以降これまでの累積の推計受診者数は約 0.9 万人となった。 あまりに数字が少なすぎるので、もはや細かい数字を比較してもしょうがないし、緊急事態宣言が出ている地域が含まれていることを考えれば数値が正確かも分からないので、今日は国立感染症研究所のインフルエンザ流行レベルマップをいくつか紹介することにします。 ちな

                                                                  インフルエンザ報告数 例年累計患者数500万人→今年1万人以下 ※ - 斗比主閲子の姑日記
                                                                • 2019-nCoVについてのメモとリンク

                                                                  リンク集目次 国内外の状況 政府機関・国際機関等 学術情報 疫学論文 分子生物学/ウイルス学論文 臨床論文 インフォデミック関係 ワクチン関係 変異株関係 時系列メモ目次 新型コロナウイルス(2020年1月6日,11日) インペリグループによる患者数推定(2020年1月18日) 患者数急増,西浦さんたちの論文(2020年1月20日,23日) WHOはPHEIC宣言せず(2020年1月23-24日) 絶対リスクと相対リスク(2020年1月26日) 研究ラッシュが起こるかも(2020年1月27日) なぜ新感染症でなく指定感染症なのか? なぜ厚労省令でなく閣議決定なのか?(2020年1月27日) コロナウイルスに対する個人防御(2020年1月27日) 国内ヒト=ヒト感染発生(2020年1月28日) フォローアップセンター設置,緊急避難等(2020年1月29日) PHEICの宣言(2020年1月3

                                                                  • IPAマンガでわかるソフトウェア開発データ分析38編.pdf

                                                                    マンガでわかる ソフトウェア開発 データ分析 データ分析事始め データ分析FAQ (参考)アジャイルメトリクスFAQ 1 独立行政法人情報処理推進機構 超合本版38編 データ分析事始め 目次 データ分析基礎編 01 データ分析ってなんなの? データ分析 02 信頼幅の線、気になる 信頼幅 03 箱ひげ図のひげ、かわゆくない 箱ひげ図 04 散布図はぜんぜんばらばら 散布図と箱ひげ図 05 どれが本命なの? 中央値と平均値 分析データ観察編 01 生産性は性癖が出る? 生産性 02 バグを愛したソース 信頼性(不具合密度) 03 改修・保守が好き過ぎる 開発プロダクトの種別 04 規模はアンバランスでアンビバレント ソフトウェア規模 05 開発期間は短くて長くて短い 開発期間(工期) 06 ウォーターフォールってつおい? ウォーターフォール型開発 07 ここはツールでしょ 開発ツール 08

                                                                    • 外科医が誕生日に行った手術の死亡率は、他の日に行った手術よりも高いのか?

                                                                      私達の研究グループは、アメリカの65歳以上の高齢者で17の外科手術のいずれかを受けた約98万人を対象とした大規模な医療データを用いて、外科医の誕生日に手術を受けた患者の死亡率が、誕生日以外の日に手術を受けた患者の死亡率よりも高いことを明らかにしました。同じ外科医に治療された患者を比較しても同様の結果で、誕生日に手術を受けた患者の死亡率は、誕生日以外の日に手術を受けた患者の死亡率よりも1.3%(リスク差)増加していました(リスク比で+23%の増加率)。これは臨床的にも無視できない意味のある差だと考えられます。 慶應義塾大学大学院健康マネジメント研究科の加藤弘陸特任助教(研究実施時はカリフォルニア大学ロサンゼルス校[UCLA]訪問研究員)との共同研究です。 着信音や医療機器のトラブル、手術内容とは必ずしも関係ない会話など、手術中の外科医の注意をそらすような物事は多く存在しているといわれています

                                                                        外科医が誕生日に行った手術の死亡率は、他の日に行った手術よりも高いのか?
                                                                      • 一般的な会食における集団感染事例について

                                                                        国立感染症研究所 実地疫学専門家養成コース(FETP) 同 感染症疫学センター 掲載日:2020年10月16日 背景 2020年10月9日現在、国立感染症研究所実地疫学専門家養成コース(FETP)は新型コロナウイルス感染症(COVID-19)クラスター対策班として35都道府県からのべ120事例のCOVID-19集団発生事例に対する調査派遣依頼に対して、都道府県、管轄保健所とともに実地疫学調査を実施してきた。今後のCOVID-19対策に資する情報提供を目的として、FETPが関わった実地調査結果の中から類似した環境下における感染伝播の状況をまとめて報告していく。今回は、「一般的な会食」(以下、会食という。)における集団感染についてまとめた。 方法 2020年10月9日時点において、2020年2月25日以降に、クラスター対策班として実施した実地疫学調査のうち、会食で発生した集団感染における曝露状

                                                                        • 検査について

                                                                          いまから、検査について説明します。 検査の話をすると、どんな話をしても必ずどっかからすごい怒られます。だから、この原稿も本にするだけでネットに挙げないつもりでいました。本ならば、基本的には少なくとも最後までちゃんと読まなければ文句は言えないので(読まずに文句言う人もいますが、、、密林とかで)。しかし、最近「入院患者は全員PCRだー」といった意見があちこちで聞こえるようになったので、イヤイヤ、ネットに上げざるを得ませんでした。先回りして結論を今言っておきますが、入院患者全員にPCRは、しないほうがいいです。 相変わらず長いです(笑)。最後まで読まない人、読めない人はからんでこないでくださいね(笑)。我ながら、よい予防線だ。 まずはPCRから PCR、ポリメラーゼ連鎖反応はウイルスの遺伝子を見つける検査です。定量的な検査と、定性的な検査があります。 定量的な検査とは、ウイルスがたくさんいますよ

                                                                            検査について
                                                                          • ドイツのコロナ対策班がクラスター対策の重要性を訴え始めた|ショーンKY

                                                                            ドイツ新型コロナ対策チームの中心人物の一人、ウイルス学者のクリスティアン・ドロステン氏は、この数日スーパースプレッダーの存在に着目した見解を出している。この発言の背景になっているのは、スーパースプレッダーについて論じた最近のいくつかの研究である。これらの研究については、Science誌のドイツ特派員からの報告にまとまっている。 その中の一つ、スイスの研究チームによる数理疫学的な研究では、新型コロナウイルスは大量の二次感染を起こす少数の人と二次感染を起こさない多数の人に分かれ(dispersion parameter (k)が小さい)、インフルエンザとは異なる伝播様式なのではないかとしている。ロンドン大学衛生熱帯医学大学院(London School of Hygiene & Tropical Medicine; LSHTM)の研究チームは、R₀が1.4-12、kが0.04-0.2(95%信

                                                                              ドイツのコロナ対策班がクラスター対策の重要性を訴え始めた|ショーンKY
                                                                            • 久里浜医療センター、男性のインターネット・ゲーム障害有病率を男性16.2%とする論文を書く - 井出草平の研究ノート

                                                                              久里浜医療センターはちっとも科学的研究をしないという批判に応えてなのか、最近、久里浜から基礎研究の論文がいくつか出ている。今回は10月に出版されたIGDT-10というインターネット・ゲーム障害(DSM-5)についての論文を取り上げる。 Mihara, S., Osaki, Y., Kinjo, A., Matsuzaki, T., Nakayama, H., Kitayuguchi, T., Harada, T., & Higuchi, S. (2022). Validation of the Ten-Item Internet Gaming Disorder Test (IGDT-10) based on the clinical diagnosis of IGD in Japan. Journal of Behavioral Addictions. https://doi.org/10

                                                                                久里浜医療センター、男性のインターネット・ゲーム障害有病率を男性16.2%とする論文を書く - 井出草平の研究ノート
                                                                              • 酷く質の悪いワクチン関連論文を元に、さらにネット上で誤解釈で大変なデマが出回る : やまもといちろう 公式ブログ

                                                                                ワクチン接種と国民の態度については、それ相応に各種の事前研究が進み、接種計画に反映されたりしています。なので、ある程度は関係者の間では「肌感」があるところなのですが、さっきTwitterを見ていたら「Facebookユーザーの大多数がワクチン接種を拒否」とか「18歳から29歳までの40%以上がワクチン接種に否定的」とかいう明らかなガセネタが出回っていたので(既に削除)、元論文を観に行きました。 そしたら、元ネタは独立行政法人産業経済研究所(RIETI)が発行したディスカッションペーパーのていをした調査報告書だったわけなんですが、流し読みして悶絶するような個所がいくつかあり、椅子から落ちそうになりました。 https://www.rieti.go.jp/jp/publications/dp/21j026.pdf 元データが開示されていないので検証のしようもないんですが、まず、18歳から29歳

                                                                                  酷く質の悪いワクチン関連論文を元に、さらにネット上で誤解釈で大変なデマが出回る : やまもといちろう 公式ブログ
                                                                                • 西浦先生らによる実効再生産数の統計モデルを解説&拡張する試み - StatModeling Memorandum

                                                                                  先日の西浦先生のニコ生の発表を聞いていない人はぜひ聞いてください。 モデルとデータを以下のリポジトリでオープンにしていただいたので、モデルについて僕が分かる範囲内で少し解説を加えたいと思います。 github.com 実効再生産数を推定するコードが2種類ありまして、最尤推定(Maximum Likelihood Estimation, MLE)を使ったMLE版(Sungmok Jungさん作成)と 、ベイズ推定版(Andrei Akhmetzhanovさん作成)があります。どちらもコンセプトはほぼ同じで、実装が若干異なります。この記事では、ベイズ推定版(以降、元コードと呼びます)の流れを簡単に説明し、その後でその拡張を試みます。 ベイズ推定版の流れ 大きく分けて「データの集計」「back projection」「実効再生産数の推定」の3つの部分からなります。 データの集計 まずは日付ごとの

                                                                                    西浦先生らによる実効再生産数の統計モデルを解説&拡張する試み - StatModeling Memorandum