並び順

ブックマーク数

期間指定

  • から
  • まで

761 - 800 件 / 1349件

新着順 人気順

statisticsの検索結果761 - 800 件 / 1349件

  • ポケモンを題材に因果推論を実践してみる - kanayamaのブログ

    問題設定 有意差検定 交絡因子の存在 線形重回帰によるモデル化 回帰係数の推定 回帰係数の仮説検定 補足など 残差の分布について 他の交絡因子について データの生成方法について 参考文献 @tkanayama_です。最近「計量経済学*1」と「効果検証入門 *2」を読んだので、せっかくなので実際に手を動かすことによって理解の整理をしたいと思いました。 www.yuhikaku.co.jp gihyo.jp そこで今回は、人工データを用いて「ボールの性能と捕獲確率」の関係性を効果検証してみました(人工データの生成方法は記事の末尾に記述しました)。 問題設定 今は昔、モンスターボールしか存在せず、スーパーボールが世の中で出回り始めたばかりの頃、オーキド博士が「スーパーボールは本当にモンスターボールより捕まえやすいのか?」という仮説を検証しようとしています。 そこでオーキド博士は世界中のトレーナー

      ポケモンを題材に因果推論を実践してみる - kanayamaのブログ
    • スペイン、抗体陽性は国民の5% 6万人検査、集団免疫「なし」 | 共同通信

      【パリ共同】スペイン保健省などは13日、全国で4月下旬から約6万人が参加して行った新型コロナウイルスの感染歴を調べる抗体検査で、陽性の割合は約5%だったとの暫定結果を発表した。 PCR検査による国内の感染確認者はこれまで約23万人。今回の結果によれば全人口約4700万人のうち約235万人が感染したとみられることになるが、スペイン通信によると、責任者のマリナ・ポジャン博士は記者会見で「集団免疫にはほど遠い。感染再拡大の可能性はあり、慎重な対応が賢明だ」と述べた。

        スペイン、抗体陽性は国民の5% 6万人検査、集団免疫「なし」 | 共同通信
      • マイナンバーカード 本人希望で廃止のうち自主返納は4割近く | NHK

        マイナンバーカードが廃止された理由を調べるため、総務省が全国12の市と町を抽出して調査したところ、先月の1か月間に本人の希望などを理由に廃止されたおよそ250件のうち、4割近くが自主返納だったことが明らかになりました。 これは18日開かれた立憲民主党のマイナンバーカードをめぐる合同会議で、総務省の担当者が明らかにしました。 マイナンバーカードの本人の希望による廃止は、先月1か月間で全国でおよそ2万件あったことが分かっていますが、カードに新しい住所を追記する余白がなくなり、再発行のため返納する例なども含まれていました。 このため、総務省が全国12の市と町を抽出して聞き取り調査を行ったところ、先月1か月間に本人の希望などを理由に廃止されたカード247件のうち自主返納されたものは4割近くにあたる97件でした。 残る150件は再発行するために返納したケースや、外国人が在留期間の満了前に期間を短縮し

          マイナンバーカード 本人希望で廃止のうち自主返納は4割近く | NHK
        • ベイズ深層学習(3.3~3.4)

          筑波大HCOMP研究室の勉強会資料です. 内容はベイズ深層学習(著 須山敦志)の3.3から3.4節です. 日本一(誇張)ベイズ線形回帰の計算を丁寧に書いたつもりです. 本に誤記の"可能性"があります.(自分の計算が間違っている可能性もある.) 違うとかあれば連絡ください.

            ベイズ深層学習(3.3~3.4)
          • 国土交通省「建設工事受注動態統計」問題を紐解く(上) | 研究プログラム | 東京財団政策研究所

            Review 経済・財政、環境・資源・エネルギー 国土交通省「建設工事受注動態統計」問題を紐解く(上) December 16, 2021 EBPM 経済政策 リアルタイムデータ 経済データ:Review 本問題について取り上げた、朝日新聞社「国土交通省による基幹統計の不正をめぐる一連のスクープと関連報道」が、2022年度日本新聞協会賞に選ばれました。 ▼朝日新聞社・伊藤氏の受賞報告寄稿に、平田主席研究員のコメントが掲載されております。 https://www.pressnet.or.jp/journalism/award/2022/index_7.html (2022年10月11日) はじめに 12月15日の朝日新聞朝刊の報道によると、2019年の厚生労働省の毎月勤労統計(毎勤統計)の不正問題に続き、今度は国土交通省で不正が疑われる統計問題が発覚した。毎勤統計問題は政府からの給付金に影響

              国土交通省「建設工事受注動態統計」問題を紐解く(上) | 研究プログラム | 東京財団政策研究所
            • 「エンジニアに向いている人」はGitHub user内にどれぐらいいるのか - Qiita

              注意 この記事はとあるツイートを話題にしていますが、筆者にツイート内容、およびツイートされた方を蔑む意図は一切ありません。 筆者は統計、およびプログラミングに関してはまだまだひよっこです。したがって誤った見解や拙いコードを書いている可能性がありますが、お気づきの際は是非コメントにてご指摘ください。 背景 あけましておめでとうございます! 正月休みもあけ仕事も始まりましたが、みなさまいかがお過ごしでしょうか。 さて、正月早々、とあるツイートが反響を呼びました。 プログラミングスクール通ってるかどうかとかどうでもよくて、この年末年始にコード全く書いていない人はエンジニア向いてないんじゃないですかね、それぐらい好奇心が必要な職業だと思うけど 賛否両論あったこのツイートですが、内容はさておき、私はあることが気にかかりました。 「果たしてこの年末年始、コードを書いた人はどのぐらいいるのだろうか」 本

                「エンジニアに向いている人」はGitHub user内にどれぐらいいるのか - Qiita
              • 【「0.05」の謎】統計学好きでも意外と知らない「統計的に有意」の本当の正体

                心理学者。キングス・カレッジ・ロンドンの精神医学・心理学・神経科学研究所の講師。2015年に科学的心理学会(アメリカ)の「期待の星(ライジンング・スター)」賞を受賞。『タイムズ』『ワシントン・ポスト』『ワイアード』などに数多く寄稿し、BBCラジオなどの出演もある。 Science Fictions あなたが知らない科学の真実 スタンフォード監獄実験はイカサマだった! 権威ある心理学研究の100件のうち、再現に成功したのはたったの39%!? 科学の信頼性を根底から揺るがす「再現性の危機」に迫る真実の書、日本上陸! 科学における不正・怠慢・バイアス・誇張が起きる仕組みを多数の実例とともに解説。既存の本で知ったウンチクを得意げに語る人に読ませたい、真実の書。 バックナンバー一覧 「すべての科学研究は真実である」と考えるのは、あまりに無邪気だ――。 科学の「再現性の危機」をご存じだろうか。心理学、

                  【「0.05」の謎】統計学好きでも意外と知らない「統計的に有意」の本当の正体
                • 民放、衝撃のCM収入減 「ステイホーム」期間中、「スポット」不振 3〜4割下落:東京新聞 TOKYO Web

                  新型コロナウイルスの影響で中止続きだった民放キー局(日本テレビを除く)の社長定例記者会見が約三カ月ぶりに再開した。各局ともおおむね四、五月の「ステイホーム」期間中、視聴者の在宅率が上がり多くの人に見られていたが、経営の根幹であるCM収入は大ダメージとなる衝撃的な数字を記録したという。 (原田晋也) 「精査はしていないが、過去最大クラスだろう。われわれは普通、2%や3%下がったら『大変だ!』と言っているのに、それが30%や40%も落ちているわけですから」。八日のTBSの定例会見で、佐々木卓(たかし)社長はCM収入についてこう言及した。 テレビCMには、番組と一体となった枠で放送し、特定の視聴者層に見てもらいやすい「タイムCM」と、番組の合間などさまざまな時間に流される「スポットCM」がある。TBSによると、同社の四月のスポットCM収入は前年比で77%台、五月が59%台だったという。

                    民放、衝撃のCM収入減 「ステイホーム」期間中、「スポット」不振 3〜4割下落:東京新聞 TOKYO Web
                  • 統計学・機械学習を自分なりに概観してみた - Qiita

                    *この記事は統計学や機械学習を専門としていない学生が書いた主観的なまとめ記事です。間違いが含まれている可能性があります。 統計学・機械学習を学んでいると、たくさんの手法や考えが出てきてよくわからなくなります。 特に自分が何かに取り組んでいるときには、今やっている手法が全体から見てどういうものなのか、より良い手法が無いのかが気になってしまいます。 まるで地図を持たず森の中を彷徨っているような感覚です。 そこで、統計学・機械学習で使われる概念や手法を自分なりにまとめて頭を整理したいと思います。 以下のような図になりました。 以下にそれぞれを説明します。 数理科学 統計学・機械学習のベースとなる学問です。 主に解析学、代数学、幾何学からなります。 微分積分学と線形代数学が基本になってるのは言うまでもないと思います。 その他に個人的に関わりが深いと思う分野を3つ挙げます。 確率論 大数の法則(中心

                      統計学・機械学習を自分なりに概観してみた - Qiita
                    • 30分で理解するセイバーメトリクスの教科書 - 野球を統計的に楽しもう - Lean Baseball

                      このブログをはじめた当初に「大好きな野球のデータ分析をもっと知ってほしい」というモチベーションでこんな記事を書きました. shinyorke.hatenablog.com 執筆・公開した5年前(2014年)と比べ, 野球に限らず, スポーツ界隈全体で公開データが増えた. 例えばこれとか(スポーツ以外も含む). 野球に限らず, 様々な技術革新により, 扱うデータの種類・量が爆発的に増加(例:Baseball Savant). データサイエンス・機械学習といったキャリアを歩む・志望して学習をする方が増え, 「そうだスポーツでやってみよう」という流れも盛ん. と(大変好意的な意味で*1)目まぐるしく状況が変わってきているのでここで改めて, セイバーメトリクス(含むスポーツの統計学)とは何か? かんたんなセイバーメトリクスとむずかしいセイバーメトリクス 何をどう学べばよいのか?のヒントなど を最新

                        30分で理解するセイバーメトリクスの教科書 - 野球を統計的に楽しもう - Lean Baseball
                      • インフォグラフィック: 2021 年開発者エコシステムの現状

                        2021 年開発者 エコシステムの現状このレポートは、今年で 5 回目となる JetBrains 実施の年次開発者エコシステムアンケートの結果をまとめたものです。183 の国または地域から 31,743 人の開発者にご協力いただき、開発者コミュニティの展望を導き出しています。 テック産業の最新のトレンドと、ツール、テクノロジー、プログラミング言語に関する興味深い情報、およびプログラミング業界のその他の事実をご覧ください。

                          インフォグラフィック: 2021 年開発者エコシステムの現状
                        • 日本、中国など海外の新型コロナウイルス変異株の状況は?アメリカで急激に広がるXBB.1.5の特徴は?(忽那賢志) - 個人 - Yahoo!ニュース

                          2023年1月現在、日本は第8波の真っ只中にあり、感染者も増え続けています。 新しい変異株が流入することで、さらに感染者の増加につながる可能性があります。 現在の日本や海外での変異株の状況についてご紹介します。 日本では現在もBA.5が主流日本での変異株の移り変わり(https://covariants.org/より作成) オミクロン株が世界に現れたのは2021年11月ですが、約1年経過した現在もオミクロン株の亜系統が99.9%を占めており、オミクロン株以外の系統の変異株はほとんど見つかっていません。 日本では、第6波が起こった2022年1月頃からオミクロン株BA.1が主流となり、その後BA.2に置き換わり、第7波の初期からBA.5に置き換わっています。今も日本ではBA.5が半分以上を占めているという状況です。 東京都の変異株の割合の推移(東京都. モニタリング項目の分析. 令和5年1月5

                            日本、中国など海外の新型コロナウイルス変異株の状況は?アメリカで急激に広がるXBB.1.5の特徴は?(忽那賢志) - 個人 - Yahoo!ニュース
                          • シンプソンのパラドックスのはなし - 渋谷駅前で働くデータサイエンティストのブログ

                            今月はモデルナワクチンの2回目接種*1やら仕事でも負荷の高い分析業務やら、はたまた執筆*2やらでネタ切れなのもあってあまりブログ記事を書けていなかったので、最近話題になった件について簡単に論じてみようかと思います。元ネタはこちらです。 これはイスラエルで公表されたCOVID-19ワクチンの重症化防止効果に関する統計について、いわゆる「シンプソンのパラドックス」が見られるのでそれを補正する必要があると指摘するブログ記事です。この件について僕が引用しながらボソッと放言したところ、思いの外大きな反響があったのでした。 イスラエルで起きている、「ワクチンが効いていないように見える」シンプソンのパラドックス。年齢で調整するとこうなるという分かりやすい解説https://t.co/gQrATCNzS7 pic.twitter.com/JI8Gq8h0Lk— TJO (@TJO_datasci) 202

                              シンプソンのパラドックスのはなし - 渋谷駅前で働くデータサイエンティストのブログ
                            • 「満足度No.1」の広告 大半の事業者 根拠内容を把握せずに表示 | NHK

                              「顧客満足度No.1」などと表示する広告について、消費者庁が実態を調査した結果、ヒアリングに応じた事業者のほとんどが、根拠となるアンケート調査の内容を把握せずに、「No.1」などと表示していたことが分かりました。 「顧客満足度No.1」など、いわゆる「No.1」広告をめぐって、一部で客観的な裏付けがないにもかからず表示するケースが相次いでいることから、消費者庁はことし3月から9月にかけて実態調査を行い、26日に報告書を公表しました。 この中で「No.1」広告などを掲載していた事業者15社を業種が偏らないように選び、ヒアリングしたところ、1社を除く14社が、根拠となるアンケート調査がどのように消費者に対して行われているかを把握していませんでした。 理由について、事業者からは ▽「調査会社を信頼して任せていた」 ▽「他社も行っているやり方で、問題ないと思った」 などの回答があったということです

                                「満足度No.1」の広告 大半の事業者 根拠内容を把握せずに表示 | NHK
                              • 数字のバラ付きを考慮して意思決定する技術 - Hatena Developer Blog

                                こんにちは。MackerelチームでCRE(Customer Reliability Engineer)をしているid:syou6162です。主にカスタマーサクセスを支えるデータ基盤の構築や、データ分析を担当しています。 意思決定をする際には不確実性がつきまといますが、不確実性を信頼区間という形で考慮して意思決定を行なおう、という話をします。 この記事ははてなエンジニア Advent Calendar 2020の4日目の記事です。 前日はid:dekokunさんによるGoogle Cloud の Associate Cloud Engineer 資格を取得するためにした勉強でした。 数字のバラ付きを考慮して意思決定したいケース: NPSでの事例 統計学を使って数字のバラ付きを考慮する: 信頼区間 NPSの信頼区間をSQLで計算する まとめ 数字のバラ付きを考慮して意思決定したいケース: N

                                  数字のバラ付きを考慮して意思決定する技術 - Hatena Developer Blog
                                • 「モラリスト×エキスパート」を育む立正大学データサイエンス学部の『データサイエンティスト赤ずきん』がヤバい

                                  リンク 立正大学データサイエンス学部 2021年4月開設 立正大学データサイエンス学部 2021年4月開設 立正大学データサイエンス学部 2021年4月開設『データサイエンス鬼退治図絵 データサイエンティスト桃太郎』 5 users 426 鈴木 正朝 @suzukimasatomo 立正大学の素晴らしい広告。しかし、この赤ずきんはいただけない。顔識別システムによる犯罪者予備軍の検知は保安処分と背中合わせだ。赤ずきんこそ狼ということになる。データサイエンティスト養成は日本の急務であるが最低限の法学知識を教育プログラムに入れておこうず。 ris.ac.jp/ds/ad/lp1/stor… 鈴木 正朝 @suzukimasatomo 情報理工学的視点があるからこそ解明できる情報法制というところもあるので、実は法学は遠い学問ではなく意外と親和性があるとも言える。こういう勉強を大学でやっていけばど

                                    「モラリスト×エキスパート」を育む立正大学データサイエンス学部の『データサイエンティスト赤ずきん』がヤバい
                                  • 武漢の改善、欺瞞と医師が告発 習氏視察で隔離解除、検査停止 | 共同通信

                                    【北京共同】新型コロナウイルス感染症の被害が最も深刻な中国湖北省武漢市で、10日に行われた習近平国家主席による視察に合わせ、症状の残る多数の患者が隔離を急きょ解除され、一部の感染検査も停止されたことが19日、分かった。隔離施設の医師が共同通信の取材に、武漢市の状況改善は欺瞞だと告発した。 医師は、習氏への配慮から対策成功アピールのため治療中の患者数を意図的に減らしていると指摘した。中国で現場の医師がこうした告発を行うのは異例。中国政府は武漢で18日に新規感染者が0人になったと発表したが、医師は政府の集計は「信頼できない」と断言した。

                                      武漢の改善、欺瞞と医師が告発 習氏視察で隔離解除、検査停止 | 共同通信
                                    • 個人投資家ボロ負け説 - 小型株投資の日記

                                      昔、日経が7,000円台の頃があって、アベノミクスがあって、色々あって、コロナあって、色々あって、今や4万円近いわけですけども、実は個人投資家はあんまり儲かってないっていう説があるらしい。 そんなバカことがあってたまるか、と思いまして、一応確認してみました。 財務省の確定申告のデータがまとめてあるサイトから、株式譲渡に関する資料をグラフにしました。 青が申告者数、30~60万人くらいで、なんとなく上向きトレンドのように見え、参加者は増加傾向。 オレンジは還付申告した人数で、増加傾向。これは、昨年以前に累損があって、今年は利益が出たって人かな? その一方、緑が納税申告した人数(たぶん、累損が無くて今年も儲かった人)ですが、12~22万人で推移していて、とても緩やかに増加。 ここで、緑の納税申告者の所得は2022年で3.74兆円、それに対してオレンジの還付申告者は0.4兆円となっているので、い

                                        個人投資家ボロ負け説 - 小型株投資の日記
                                      • 「JavaとCの長年の覇権は終わった」プログラミング言語の人気指標でPythonがついに1位に【やじうまWatch】

                                          「JavaとCの長年の覇権は終わった」プログラミング言語の人気指標でPythonがついに1位に【やじうまWatch】
                                        • 統計初心者が統計モデリング力を鍛えるための勉強法 - Qiita

                                          以前、『結局、統計モデリングとは何なのか』という記事を書きました。 この記事は、その名の通り、「そもそも」何が統計モデリングで、何が統計モデリングではないのかということを扱った記事です。 今回は、「統計モデリングとは何か」を理解した方に向けて、実際に「統計モデリング力」を鍛えるためにはどうするかを書いていきたいと思います。 この記事の目的と対象者 上記でも述べたようにこの記事の目的は、どのように「統計モデリング力」を鍛えるかを書くことです。 統計学に入門するところから、高度な統計モデルを扱えるようになるまでの勉強法について書いています。 したがって、統計初心者からそれなりに理解している人までの幅広い層が想定読者となります。 ところどころで、プログラム言語で実際に手を動かしながら学ぶタイプの本を紹介することもありますので、そういった本を読むためにはPythonまたはRの知識が必要になります。

                                            統計初心者が統計モデリング力を鍛えるための勉強法 - Qiita
                                          • “経済失速”が叫ばれる中国 相次ぐデータ公表停止の謎 | NHK | WEB特集

                                            経済の動向をみる上で欠かせない統計データ。中国では、過去最悪となっていた若者の失業率が7月分から公表停止になるなど、不都合ともいえるデータの更新が止まっている。 実際に、どのくらいの数が止まっているのか。今回、番組取材班が徹底調査。すると、習近平氏が国家主席に就任した2013年以降、さまざまなデータの更新が止まっていることが判明した。独自検証で見えてきた、中国統計データの実態とは――。 (NHKスペシャル シリーズ調査報道・新世紀File1 中国“経済失速”の真実 取材班) 取材班はまず、中国の国家統計局が発表する統計データを調べてみた。 中国は景気回復の勢いが鈍化し、若者の間で雇用に対する不安が広がっている。2018年から発表されてきた年齢別の失業率は、都市部の16~24歳が今年6月に過去最悪を記録するなどして、注目を集めていた。 しかし、国家統計局は8月、「年齢層別の失業率については、

                                              “経済失速”が叫ばれる中国 相次ぐデータ公表停止の謎 | NHK | WEB特集
                                            • 「孤独を感じることがある」年代では30代が最高 国の実態調査 | NHK

                                              国の実態調査で、孤独を感じることが「しばしばある・常にある」と回答した人は、全体の5%で、それぞれの年代では30代が最も高く7%でした。国の担当者は「若い世代で孤独感の高まりがうかがえるので、対策を推進したい」と話しています。 国は、孤独や孤立の実態を把握するため、去年12月からことし1月にかけて、全国の16歳以上の2万人を対象に実態調査を行い、56%にあたる1万1218人から回答を得ました。 どの程度、孤独だと感じることがあるか尋ねたところ、 ▽「しばしばある・常にある」が5% ▽「時々ある」が16% ▽「たまにある」が20%だった一方、 ▽「ほとんどない」は41% ▽「決してない」は18%でした。 「しばしばある・常にある」と回答した人は、それぞれの年代では30代が最も高く7%でした。 また、孤独感に影響を与えたと思う出来事については、 ▽「家族との死別」が27% ▽病気やけがなど「心

                                                「孤独を感じることがある」年代では30代が最高 国の実態調査 | NHK
                                              • VR人口増加により“メタバースで生きていく”は現実になりつつある?「VRChat」の同時接続数は10万人を突破、人口は5年で約7倍に。統計データで見るメタバースの今を解説

                                                「東方Project」のファンゲームとなるダンジョン探索RPG『不思議の幻想郷 -FORESIGHT-』のPS4、Nintend 『メタバースは終わった』… 一時の劇的なメタバースブームも一旦の落ち着きを見せ、各種メディアではそんなショッキングな見出しも目立つ2024年の昨今ですが、実際のメタバース人口はブームによりどのように変化したのでしょうか? また、そのうち日本人はどれくらいの割合を占めるのでしょうか? ユーザーの性別や年齢構成はどうなっているのでしょうか? 本記事では、メタバースの革命性を論じた著書『メタバース進化論(技術評論社)』で「ITエンジニア本大賞2023(翔泳社)」を受賞し、MoguLive VTuber Award 2023「今年最も輝いたVTuber」にも選出された筆者「バーチャル美少女ねむ」が各種統計データを元に徹底解説します。約5,500字、書き下ろしです! 文/

                                                  VR人口増加により“メタバースで生きていく”は現実になりつつある?「VRChat」の同時接続数は10万人を突破、人口は5年で約7倍に。統計データで見るメタバースの今を解説
                                                • 下水サーベイランス/札幌市

                                                  インフルエンザ対策に関しては、下記のページをご覧ください。 インフルエンザの知識と予防(札幌市保健所のページ) ※1【下水中のウイルスRNA濃度】 定量PCR法によって検出された下水1リットルに含まれるウイルスの遺伝子数(コピー)であり、この値が大きいほど下水の処理区域内に感染者が多く存在していると推定されます。 この調査では、降雨による影響を補正した、1週間に測定したすべての検体の幾何平均値(相乗平均値)を示しています。 ※2【下水からの検出率】 1週間に分析した下水検体数のうち、ウイルス遺伝子が検出された(検出限界93コピー/L)検体数の割合であり、この値が大きいほど感染の面的な広がりが進行していると推定されます。 なお、「不検出」とは、ウイルスが全く存在しないということではなく、検出限界(ウイルスの有無を判定できる最小値)未満であったことを示しています。 ※3【定点医療機関の患者報告

                                                  • 刑事司法は“女性に甘い”? 統計から見えてくる「女性の殺人」と「量刑」の傾向とは(弁護士JPニュース) - Yahoo!ニュース

                                                    10月19日、小学校低学年の女児を何度も殴ったり蹴ったりした容疑で、北海道・小樽市在住の40代前半の女性が傷害容疑で逮捕された。 【X投稿】裁判所の採用アカウントへ批判的な反応も 女児は搬送先の病院で死亡が確認された。女性は容疑を認めているという。なお、報道によると女児は女性の夫の連れ子であった。 女性は情状酌量や執行猶予を受けやすい?上記の事件は義母による犯行だが、実の母親が子どもを虐待・殺害する事例もある。 通常子どもの殺害や虐待死が発覚すれば、母親は警察に逮捕され、検察により起訴された後に刑事裁判となり、有罪となった場合には裁判所に量刑が宣告される。 ただ、このような事件に関する一連の流れの中で、近年X(旧Twitter)を中心に「司法は女性に甘い」「裁判所は女性を優遇している」などの言説が出回ることがある。事件関連ではないが、たとえば10月7日に裁判所の採用関係公式Xアカウントが働

                                                      刑事司法は“女性に甘い”? 統計から見えてくる「女性の殺人」と「量刑」の傾向とは(弁護士JPニュース) - Yahoo!ニュース
                                                    • [数理統計学]統計的検定のまとめ – かものはしの分析ブログ

                                                      都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト 通勤電車のなかで私が勉強する用のシリーズ第5弾です。今回は統計的検定についてまとめておこうと思います。 【これまでのシリーズへのリンク】 ・[数理統計学]統計的推定のまとめ ・[数理統計学]正規分布から導かれる分布(カイ二乗分布/t分布/F分布)の期待値と分散の導出まとめ ・[数理統計学]連続型確率分布の期待値と分散の導出まとめ ・ [数理統計学]離散型確率分布の期待値と分散の導出まとめ 目次 統計的仮説検定 検出力 一様最強力検定 ネイマン-ピアソンの基本定理 不偏

                                                        [数理統計学]統計的検定のまとめ – かものはしの分析ブログ
                                                      • P値のトリセツ

                                                        オープンな日本語埋め込みモデルの選択肢 / Exploring Publicly Available Japanese Embedding Models

                                                          P値のトリセツ
                                                        • 2023年 日本の広告費 - News(ニュース) - 電通ウェブサイト

                                                          株式会社電通(本社:東京都港区、社長:佐野 傑)は本日、日本の総広告費と、媒体別・業種別広告費を推定した「2023年 日本の広告費」を発表した。詳細は下記のとおり。 <2023年 日本の広告費の概況> ◆2023年の総広告費は、通年で7兆3,167億円(前年比103.0%)となり、1947年の推定開始以降、前年に続き過去最高を更新した。上半期(1-6月期)は、新型コロナウイルス感染症(以下、新型コロナ)の5類感染症移行に伴うリアルイベントの開催数増加や国内外の観光・旅行の活性化などにより回復がみられた。下半期(7-12月期)は、夏から秋にかけての猛暑や中東問題などの影響を受けたものの、社会・経済活動の活発化に伴い「交通・レジャー」「外食・各種サービス」「飲料・嗜好品」を中心に広告需要が高まった。進展する社会のデジタル化を背景に増加傾向が続くインターネット広告費や人流の活発化に伴って増加した

                                                            2023年 日本の広告費 - News(ニュース) - 電通ウェブサイト
                                                          • 【都道府県別】人口あたりの新型コロナウイルス感染者数の推移

                                                            日本全国の都道府県別,人口あたりの新型コロナウイルス感染者数(感染確認例)の推移です.下部の地域ボタンまたは凡例(スマホは「凡例」ボタンで表示)をクリックすると都道府県の表示,非表示の切り替えができます(地図のクリックで表示,折れ線グラフのラベルをクリックで非表示も可能).グラフのポイント上にカーソルで情報がポップアップ,クリックで強調,ドラッグで移動,マウスホイールでズーム.縦軸の初期表示は対数です.「縦軸」ボタンで通常スケールに切り替え可能です.「表示都道府県をURLに保存」ボタンを押すと,現在表示中の都道府県をブックマークで保存できます.「厚労省」「NHK」にチェックを入れて左のボタンでデータを選択すると,厚労省,NHK集計のデータも見ることができます.(NHKの集計は2022/9/27,厚労省および当サイトの集計は2023/5/8で終了しました) 【おことわり】御利用は各自の責任で

                                                            • BASIC STUDY | AVILEN AI Trend

                                                              全人類がわかるデータサイエンス 基礎

                                                              • 「教科書が教えてくれない『交絡』の話」の講義資料を公開しました - Unboundedly

                                                                先日オンラインセミナーで交絡に関するレクチャーをしました。 合計1000人以上に参加していただき、ありがとうございました。 当日の講義資料を公開します。 交絡とは何か、どうやって調整変数を選ぶか、(観察データ分析をする限り必ず生じる)未調整交絡があるというシチュエーションでどのように結果を解釈するかなどについて話しました。 大学の授業で習う教科書的な知識と、実際のデータ分析を行ううえで直面する問題とのギャップを埋めるような実践的な知識をご提供するべく、意識したプレゼンテーションです。 そのほかにも因果推論に関係する講義資料を公開しています。 合わせてご参照ください。

                                                                  「教科書が教えてくれない『交絡』の話」の講義資料を公開しました - Unboundedly
                                                                • 【統計学「p<0.05」に下げる方法】統計好きでも意外と知らない「p値ハッキング」の中身

                                                                  心理学者。キングス・カレッジ・ロンドンの精神医学・心理学・神経科学研究所の講師。2015年に科学的心理学会(アメリカ)の「期待の星(ライジンング・スター)」賞を受賞。『タイムズ』『ワシントン・ポスト』『ワイアード』などに数多く寄稿し、BBCラジオなどの出演もある。 Science Fictions あなたが知らない科学の真実 スタンフォード監獄実験はイカサマだった! 権威ある心理学研究の100件のうち、再現に成功したのはたったの39%!? 科学の信頼性を根底から揺るがす「再現性の危機」に迫る真実の書、日本上陸! 科学における不正・怠慢・バイアス・誇張が起きる仕組みを多数の実例とともに解説。既存の本で知ったウンチクを得意げに語る人に読ませたい、真実の書。 バックナンバー一覧 「すべての科学研究は真実である」と考えるのは、あまりに無邪気だ――。 科学の「再現性の危機」をご存じだろうか。心理学、

                                                                    【統計学「p<0.05」に下げる方法】統計好きでも意外と知らない「p値ハッキング」の中身
                                                                  • RからPythonへのお引越しでわかること - Jupyterと世界の野球から理解する - Lean Baseball

                                                                    サムネイルがまんま結論の一部です&タイトルでビビッと来たアナタ(+野球好き)が対象読者です. ちょっとやりたいことがあって, やりたいこと⚾のサンプルがたまたまRだった このあと自分で分析したりなにか作るんやったらPythonでやりたい せや!RからPythonに移植しちゃえば良いンゴ ってことで, 粛々とRからPythonに移植した時に気がついた事をサラッと書きたいと思います. 最初に断っておくと, RよりPythonが優秀(またはその逆)だから書き換える!って意味ではありません! どっちが優秀だの, 好みは何だのといった所は(必要と思った箇所を除き)触れないのでご了承ください.*1 というわけで, 変に力んだりマウントを取ること無く, ごゆるりとおくつろぎながら読んでもらえると幸いです. TL;DR 数式を意識しながら読んだり, 統計的にいい感じにしたい時はRの方がしっくりくる. 一方

                                                                      RからPythonへのお引越しでわかること - Jupyterと世界の野球から理解する - Lean Baseball
                                                                    • なぜ統計学には主義が必要なのか - hidekatsu-izuno 日々の記録

                                                                      前回「ベイズ統計学に関する議論を整理する」では、できるだけ中立的な視点で書くことに注力し、伊津野なりの結論については特に書かなかった。今回のエントリでは、様々な見解や調べた結果を元に私見を書く。 もちろん、伊津野は専門家ではなく、情報や理解が不足する部分については想像で補ったため「それはおかしい」と感じられる点もあるだろう。そのような記述を見つけたら、単に批判を書くのではなく、なぜ問題だと思うのか、自身のブログやTwitterなどで他の人間にも理解できるように論点を明確に書くようにしてほしい。うんこの投げ合いはうんざりだ。それに、コメント欄に批判や反論を書かれても、伊津野の理解力では適切な回答ができるとは思えない。広い範囲に意見を投げかけた方がより専門的な回答が得られ生産的だろう。*1 前置きが長くなったので本論に移ろう。 まず先に結論を述べる。現在、ベイズ統計学は「(頻度主義とは異なる)

                                                                        なぜ統計学には主義が必要なのか - hidekatsu-izuno 日々の記録
                                                                      • 中国専門家、自国製ワクチンの有効率の低さ初めて示唆

                                                                        中国北京で、新型コロナウイルスワクチンの接種を待つ人々(2021年4月8日撮影、資料写真)。(c)LEO RAMIREZ / AFP 【4月11日 AFP】中国疾病対策予防センター(CCDC)のトップが10日、既存の中国製の新型コロナウイルスワクチンの有効率が比較的低いことを改善するため、異なる種類のワクチンの併用を検討していると明らかにした。中国のトップレベルの専門家が、公の場で中国製ワクチンの有効性の低さを示唆したのは初めて。 ニュースサイト「澎湃新聞(The Paper)」は、CCDCの高福(Gao Fu)主任が四川(Sichuan)省成都(Chengdu)での会見で、当局は「既存ワクチンの有効率が低いという問題の解決策を検討する」必要があると述べたと報じた。 中国は国内で大規模な集団接種を展開している他、世界中に中国製ワクチンを輸出している。 高氏はまた、問題の解決策の一つとして、

                                                                          中国専門家、自国製ワクチンの有効率の低さ初めて示唆
                                                                        • Coronavirus tracker: the latest figures as countries fight the Covid-19 resurgence | Free to read

                                                                          Coronavirus tracker: the latest figures as countries fight the Covid-19 resurgence | Free to read

                                                                            Coronavirus tracker: the latest figures as countries fight the Covid-19 resurgence | Free to read
                                                                          • 【新型コロナ?感染症対策】ウイルス感染を恐れて検査しても、様々な問題が発生する可能性があります。(院長ブログ) - 五本木クリニック

                                                                            新型コロナの感染拡大が世界規模の広がりを見せる中、日本は他国に比べて検査数が少ないため「なぜ検査をしないのか」と疑問を投げかける医師もいれば闇雲に検査はすべきでないとする医師とで意見が分かれています。 まず新型コロナが名前の通り新型であること、そしてPCR検査の精度の問題を合わせて考えると自ずと何が正しいのかが見えてくるはずです。 新型コロナ感染を判定する検査「PCR」であっても多くの問題を抱えています日本中が新型コロナに高い関心を寄せています。 これは世界中の新型コロナの発生状況、死亡者数などを世界保健機関(WHO)、アメリカ疾病管理予防センター(CDC)、中華人民共和国国家衛生健康委員会のデータをもとにジョンズ・ホプキンズ大学が公表しているサイトです。 ウイルスに感染しているかを正確に判定する方法としてPCR(ポリメラーゼ連鎖反応 polymerase chain reactionの略

                                                                              【新型コロナ?感染症対策】ウイルス感染を恐れて検査しても、様々な問題が発生する可能性があります。(院長ブログ) - 五本木クリニック
                                                                            • 「Fitbit」でわかった睡眠と健康状態の関係とは ――グーグルなど3団体が研究

                                                                                「Fitbit」でわかった睡眠と健康状態の関係とは ――グーグルなど3団体が研究
                                                                              • 新型コロナウイルスの感染力は「発症前が最も強力」だと判明、感染者の半分が発症前の人からウイルスをうつされている可能性

                                                                                これまでも、新型コロナウイルス感染症(COVID-19)は症状がない場合や症状が出る前の段階でも人にウイルスを感染させてしまう場合があることが知られていました。さらに、新型コロナウイルス(SARS-CoV-2)が実際に人から人に感染したケースを追跡した研究により、「SARS-CoV-2は症状が出る直前が最も感染力が高い」ことが突き止められました。 Temporal dynamics in viral shedding and transmissibility of COVID-19 | Nature Medicine https://www.nature.com/articles/s41591-020-0869-5 COVID-19 may be most contagious one to two days before symptoms appear | Science News ht

                                                                                  新型コロナウイルスの感染力は「発症前が最も強力」だと判明、感染者の半分が発症前の人からウイルスをうつされている可能性
                                                                                • 「いのち短かし、恋せぬおとこ」未婚男性の死亡年齢中央値だけが異常に低い件(荒川和久) - エキスパート - Yahoo!ニュース

                                                                                  配偶関係別死亡年齢中央値を算出厚生労働省の「簡易生命表」によると、2020年の日本人の平均寿命は男性が81.64歳、女性が87.74歳だが、この寿命の長さは、男女の違いだけではなく、独身なのか結婚しているのかという配偶関係の別によっても大きく変わるのをご存じだろうか。 つまり、寿命には配偶関係が大きく影響しているのである。 2020年人口動態調査の15歳以上の配偶関係別死亡者数のデータから、男女それぞれで配偶関係別の死亡年齢中央値(平均値ではない)を算出すると以下の通りである。死亡年齢中央値ということは、その年齢で半分の50%が死んでいるという意味になる。 2020年実績値により計算 短命な独身男性男女ともに配偶者と死別した人の死亡中央値がもっとも高く、平均寿命を超える長寿である。一方で、男性では未婚の死亡年齢がもっとも低く、67.2歳で未婚男性の半分は亡くなっていることになる。これはほぼ

                                                                                    「いのち短かし、恋せぬおとこ」未婚男性の死亡年齢中央値だけが異常に低い件(荒川和久) - エキスパート - Yahoo!ニュース

                                                                                  新着記事