並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 458件

新着順 人気順

統計学の検索結果321 - 360 件 / 458件

  • YANO,Daiki|note

    Lec12: 重回帰分析④重回帰分析の解釈と適切な変数の個数 こんばんは!シルバーウィーク真っ只中ですね(とはいってもコロナがありますが)。先週は、説明変数や被説明変数をモデルに応じて様々な形に加工するという事をやりました。対数を取ったり、ダミー変数を使ったり、交差項を使ったり、状況に応じて説明変数を上手く使うことはとても大切です。(交差項はちょっとだけレベルが上がるので、必ずしも卒業論文で使う必要はないと思います。特に学部4年生から計量経済学を学び始めた方は少し間に合わないかもしれません。) それと同時に、相関のある変数同士を説明変数

      YANO,Daiki|note
    • 確率入門 確信のなさを測る 2個のサイコロと出た目の和 - 数学のブログ

      package main import "fmt" func main() { n := 0 m := 0 for r1 := 1; r1 <= 6; r1++ { for r2 := 1; r2 <= 6; r2++ { if r1+r2 > 7 { n++ } m++ } } fmt.Printf("%v/%v\n", n, m) }

      • 高橋将宜 Masayoshi Takahashi on Twitter: "y=β0+β1x1+β2x2+β3(x1*x2)+εを考えます.x1*x2は交互作用項です. 多重共線性は,x1とx2の相関が強いため,x1とx2の共通している部分からyへの効果が大きい問題をいいます.このとき,β3=0なら,回… https://t.co/gDwasUleWc"

        y=β0+β1x1+β2x2+β3(x1*x2)+εを考えます.x1*x2は交互作用項です. 多重共線性は,x1とx2の相関が強いため,x1とx2の共通している部分からyへの効果が大きい問題をいいます.このとき,β3=0なら,回… https://t.co/gDwasUleWc

          高橋将宜 Masayoshi Takahashi on Twitter: "y=β0+β1x1+β2x2+β3(x1*x2)+εを考えます.x1*x2は交互作用項です. 多重共線性は,x1とx2の相関が強いため,x1とx2の共通している部分からyへの効果が大きい問題をいいます.このとき,β3=0なら,回… https://t.co/gDwasUleWc"
        • ベイズの定理の応用 二項分布とベータ分布でベータ分布 | マサムネの部屋

          人がいなくなってしまったので、良品/不良品を仕分けるロボットを導入した。購入する際には、識別率80%くたいですよと言われていたが、導入してみると、識別率は80%もないと感じた。数日分のデータを集めたので、識別率が80%あるのか調べる。 データを20個集めると、正しく識別しているのが15個、間違いが5個だったとしましょう。 ロボットが良品/不良品を識別するという事象を二項分布でモデル化し、\( \theta \)を求めましょう。3計算を楽にするために事前分布はベータ分布とします。また、購入した側としては、事前には何も知らないという事にしたいので、\( \alpha =\beta=1 \)として、一様分布にしましょう。 上の計算に当てはめると、\( n=20 , x=15 \)です。 つまり、事後分布は、 $$\begin{eqnarray} p(\theta |n=20,x=15 ) = {

            ベイズの定理の応用 二項分布とベータ分布でベータ分布 | マサムネの部屋
          • 『紅麹の秘密 すり替え』

            ことたま社長のバラ色の空幸せ法則研究家 ことたま社長 20万人以上の多くの人に会い人は勘違いに気づけば誰でもその瞬間から幸せになれることや真実を日々ブログ記事にしています。 ことたま社長のバラ色の部屋サイト(次回開催は9月1日日) https://barabeya.base.shop/

              『紅麹の秘密 すり替え』
            • トップページ | マサムネの部屋

              筆者の説明 大学で物理、大学院で数学を専攻してました。2 1年ちょっと製造業でデータサイエンティストをやってました。 2021年からSE的な仕事を始めました。 2020年後半~2021年9月現在、勉強の時間があまり取れず記事の更新は停止中です。 twitter では、記事更新のお知らせ、最近勉強してることなどを呟いています。 各分野の代表的な話題のリンク集を置いておきます。 機械学習に関連する話題 ゼロから作るニューラルネットワーク pythonの最もメジャーなライブラリnumpy だけでニューラルネットワークモデルと呼ばれる簡単な画像認識問題を解きます。 ゼロから作るニューラルネットワーク1ゼロから作るニューラルネットワーク2ゼロから作るニューラルネットワーク3 自然言語処理 数理モデルに日本語の意味を理解させる分野です。 自然言語処理入門の入門文章の自動生成をやってみるRNN(リカレン

                トップページ | マサムネの部屋
              • 検出力とは何か?検定の正確さを示す重要な指標【簡単解説いたします】 | シグマアイ-仕事で使える統計を-

                仮説検定(以下検定)を実施することで、母集団に差が有るのかどうか評価することが出来ます。 統計の入門書にも、推定と並び必ず記載される程重要な手法です。 しかし、その検定がどれだけ信頼出来るのか、実は入門書の内容だけでは不十分だったりします。 今回は検定の確からしさを保証する、検出力について解説します。 検定の問題点分布の重なり具合検定のフローに関しては以下の記事に書いてあります。 有意差検定のやり方 【検定を分かりやすく説明します】このフローは入門書にも載っているのですが、実は抜け落ちている情報があります。 それは分布の重なり具合です。 一般的に解説されている検定の方法では、 と を区別する方法が抜け落ちています。 後述しますが、この分布の重なり具合は効果量という数字で表現されます。 サンプリングする前に、推測で設定したり、検定後に再計算したりするのです。 サンプルサイズの設定サンプルサイ

                  検出力とは何か?検定の正確さを示す重要な指標【簡単解説いたします】 | シグマアイ-仕事で使える統計を-
                • pooneilの脳科学論文コメント: ベイズ更新

                  ベイズ更新では、そのつど与えられたデータから計算した事後分布を、次のデータが与えられたときは事前分布として使うことで、事後分布を逐次更新してゆく。 たとえば一定のパラメーター を持つ生成過程(たとえば2項分布)から生成されるデータ があったとすると、ベイズの定理より、 となる。これはデータ を一挙に与えられた場合だけど、代わりにデータ をひとつずつ順番に取得して事後分布を更新するのがベイズ更新。まず から始めると、

                  • イェジ・ネイマン - Wikipedia

                    Jerzy Neyman イェジ(イェルジー)・ネイマン(Jerzy Neyman, 1894年4月16日 - 1981年8月5日)は数理統計学者。エゴン・ピアソンとともに現代の推計統計学の中心的理論を確立した。 父はポーランド系(元来ユダヤ系だがカトリック信者)の法律家で、ロシア帝国内各地で仕事をしていた。イェジは次男として生まれ、1912年ハリコフ大学に入学、セルゲイ・ベルンシュテインに数学を学んだ。在学中にカール・ピアソンの「科学の文法」を読み強い影響を受けた。ロシア革命後の混乱期も(一時敵国人として拘束されたが)大学で研究を続け、1921年ポーランドに移った。ビドゴシチ農業研究所、翌年にワルシャワの国立天文台で働き、1923年にワルシャワ大学助教授となって確率論と統計学を講じた。 1925年、ロンドン大学のピアソンのもとに留学した。ピアソンはもはや測度論的確率論など最新の理論には疎

                      イェジ・ネイマン - Wikipedia
                    • 条件付き確率についてです。事象Aと事象Bがあるとき、P(A⋂B)=P(A)×Pa(B)という式が成り立ちますが、なぜP(A... - Yahoo!知恵袋

                      条件付き確率についてです。 事象Aと事象Bがあるとき、P(A⋂B)=P(A)×Pa(B)という式が成り立ちますが、なぜP(A)をかけるのでしょうか? 条件付き確率についてです。 事象Aと事象Bがあるとき、P(A⋂B)=P(A)×Pa(B)という式が成り立ちますが、なぜP(A)をかけるのでしょうか? 事象Aがおこり、事象Bもおこるのなら、P(A⋂B)=P(A)×P(B)となるのではないかと思ってしまいます。条件付き確率の根本的なところが理解できていないので、分かりやすく説明を宜しくお願いします。

                        条件付き確率についてです。事象Aと事象Bがあるとき、P(A⋂B)=P(A)×Pa(B)という式が成り立ちますが、なぜP(A... - Yahoo!知恵袋
                      • 傾向スコア - 共立出版

                        近年の統計科学では、原因と結果の因果関係を正確に知ろうとするアプローチが盛んであり、これらのアプローチは一般に因果推論と呼ばれている。本書で扱う傾向スコアも、因果推論を主眼とする方法の一つである。一般的に、処置の有無をランダムに割り当てることのできない調査観察データでは、処置群と統制群の間に属性の違いが生じる。傾向スコアとは処置の有無に影響を与える複数の情報を集約した要約指標であり、この要約指標を用いて、あたかもランダム化実験が行われたかのように、処置群と統制群の元々の属性の違いを調整する。 本書では、第1章で傾向スコアの基礎となる方法や仮定をレビューし、第2章で傾向スコアのモデリングと評価の概要について説明する。また一般的な傾向スコア法(マッチング、層別化、逆確率加重、共変量調整)をレビューし、第3章では、これらの手法のうちいずれの方法を採用すべきなのかを検討する。さらに、第4章では、処

                          傾向スコア - 共立出版
                        • データサイエンス100本ノック(構造化データ加工編)をやってみた感想|まりーな/エンジニア

                          会社で分析業務を行う際、SQLを書いて可視化というよりかは、もうすこし楽な手段がないか探していた。 社内ではjupyterhubの環境があるが、実はjupyter notebookを今まで触ったことがなかったので、心理的ハードルが高い状態にあった。 かんたんな分析ができるようになるまでのロードマップ1. jupyter notebookに慣れる 2.データインポートのやり方を知る 3.pandasの使い方を知る 4.可視化を知る という感じで道のりを考えた。 とりあえず、下記の本を読んで写経していると,pandasの扱い方がわからないとなんともわからんなと思った。

                            データサイエンス100本ノック(構造化データ加工編)をやってみた感想|まりーな/エンジニア
                          • ブログ記事一覧-裏 RjpWiki

                            Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 算額(その2100) (2024年09月19日 | Julia) 算額(その2100) 百三 群馬県高崎市八幡町 八幡宮 安政7年(1860)群... 算額(その2099) (2024年09月19日 | Julia) #和算 算額(その2099) 八十七 群馬県碓氷郡松井田町峠 熊野神社 安政... 算額(その2098) (2024年09月19日 | Julia) #和算 算額(その2098) 七十六 群馬県桐生市天神町 天満宮 嘉永5年(... 算額(その2097) (2024年09月17日 | Julia) #和算 算額(その2097) 七十二 群馬県富岡市一ノ宮 貫前神社 嘉永2年... 算額(その2096) (2024年09月17日 | Julia) 算額(その2096) 六十

                              ブログ記事一覧-裏 RjpWiki
                            • 【悲報】送りバント、統計学で非効率と証明される「損益分岐点は打率.103」 : 広島東洋カープまとめブログ | かーぷぶーん

                              広島東洋カープまとめブログ | かーぷぶーん 広島東洋カープが「ぶーん」と飛躍するまとめブログ。試合結果や速報+動画、2ch 5ch おんJのまとめ&カープファン&広島県の情報を掲載。YouTube Twitter Facebookでもプロ野球がより面白くなる情報を配信!全国のカープファンと共に戦おう。

                                【悲報】送りバント、統計学で非効率と証明される「損益分岐点は打率.103」 : 広島東洋カープまとめブログ | かーぷぶーん
                              • データサイエンスへの統計学/データの分析

                                YESオンライン スクールが運営する総合学習メディア【スマナビング!】高校数学/物理/化学と線形代数を解説!いつ・どこでもわかりやすい記事が読めます!社会人の方の学び直し(リカレント教育)にも最適。

                                • 確定診断に向けて診断テストを用いる  | がん免疫療法コラム | 6種複合免疫療法

                                  ◆陽性的中度を高めるには 前回は、陽性的中率をどうすれば高くできるのかという話で終わりました。 陽性的中率の式は、 「結果が陽性の人の内、がんかかって「いる」人)/結果が陽性の人=A/A+B」 で表せ、「A」は十分に大きいので、分母の「B」を小さくするにはどうしたら良いのかという話になりました。「B」は「偽陽性」の人数を示していますので、「偽陽性」となる人数を減らせば良いことになります。 「偽陽性」の人数「B」を特異度(D/B+D)を使って表すと、「偽陽性率=1-特異度(D/B+D)」なので、 「B」=(1-特異度(D/B+D))×(がんにかかって「いない」人 (B+D)) で表せます(表1参照)。 表1 偽陽性率の算出 ◇特異度との関係 この値を小さくするには、分子の(1-特異度)を小さく、つまり特異度を大きくするか、分母の「がんにかかって「いない」人を少なくするか、その両方を行うかのい

                                    確定診断に向けて診断テストを用いる  | がん免疫療法コラム | 6種複合免疫療法
                                  • 第15話「儲けのアイディアが無限に湧き出る!タクマ流統計講座!」 | 全シ連 ~我ら全国システムトレード勉強会連合東北支部~

                                    運営会社 お問い合わせ directed by takashi ouchi. © tukuyomi / takuma sakamoto All Rights Reserved.

                                    • 実務に必要な統計学はすべてゲームのガチャが教えてくれる 第二回 認識精度が十分かはガチャが教えてくれる - Sansan Tech Blog

                                      こんにちは。研究開発部の糟谷勇児です。 今回は第二回ということで実務の場面を想定した話を書いてみようと思います。 前回はこちらです。 buildersbox.corp-sansan.com 前回は単発ガチャ(1連ガチャ)で出る当たりの数と確率の関係を表す1連ガチャ分布(ベルヌーイ分布)と10連などのN連ガチャで出る当たりの数と確率の関係を表すN連ガチャ分布(二項分布)を紹介しました。 ところで前回は「ドラクエウォーク」を例に話しましたが、私は「ヘブンバーンズレッド」というゲームもやっています。 こちらのガチャは最高レアであるSSが出る確率が3%となっています。 つまり1連ガチャ分布(ベルヌーイ分布)はこんな感じのグラフになります。 10連ガチャ分布(N=10の二項分布)はこういうグラフになります。 さて今回は文字認識などの認識精度について考えてみましょう。 精度というと難しく感じてしまいま

                                        実務に必要な統計学はすべてゲームのガチャが教えてくれる 第二回 認識精度が十分かはガチャが教えてくれる - Sansan Tech Blog
                                      • 「デジタルトランスフォーメーション」対談 | 第2回 ― なぜ今DataCatalogなのか?

                                        「デジタルトランスフォーメーション(DX)を進めるにはデータを使うことが近道」その考えから、セゾン情報システムズではさまざまなデータをつなぐHULFT・DataSpiderに加わる新たなサービスとして「DataCatalog(仮称)」を企画しています。DataCatalogで実現する「データの地図」とはどういったものなのか、なぜ今それが必要なのか。ITRでBIシステムやデータ分析分野を担当するリサーチ・フェロー 平井 明夫氏と、DataCatalogのプロダクトマネージャーを務めるセゾン情報システムズ 吉崎 智明の対談をお届けします。 使う人が、いつでも必要なデータにアクセスできる 吉崎 最初にDataCatalogを企画した背景からお話しますと、これまで私たちはHULFTやDataSpiderといった製品で「データをつなぐ」ことに関する課題を解決してきました。しかしビッグデータ活用を進め

                                          「デジタルトランスフォーメーション」対談 | 第2回 ― なぜ今DataCatalogなのか?
                                        • 統計検定2級講座

                                          概要プレスルーム著作権お問い合わせクリエイター向け広告掲載開発者向け利用規約プライバシーポリシーとセキュリティYouTube の仕組み新機能を試してみる© 2024 Google LLC

                                            統計検定2級講座
                                          • 最短距離(最短経路)と組み合わせ

                                            最短距離(最短経路)と組み合わせの問題最短距離の問題は格子状の図形の線上を通り, 図形上の\(\small{ \ 2 \ }\)点を遠回りせずに通る場合の数を求める問題のこと。 簡単に言うと道順の場合の数を求める問題ってことになるからね。基本的な考え方から、応用問題まで考えていくから、きちんと理解していこう。 \(\small{ \ \mathrm{A} \ }\)から\(\small{ \ \mathrm{B} \ }\)に向かう最短経路の数 \(\small{ \ \displaystyle\frac{(縦の移動数+横の移動数)!}{(縦の移動数)!(横の移動数)!} \ }\) 図のように\(\small{ \ \mathrm{A} \ }\)から\(\small{ \ \mathrm{B} \ }\)まで最短に進む場合が何通りあるか考えてみよう。 \(\small{ \ \math

                                              最短距離(最短経路)と組み合わせ
                                            • 確率密度関数 - 統計WEB

                                              確率密度関数 probability density function 連続型確率変数Xについて、ある関数が下式を満たすとき、はについての確率密度関数となる。

                                              • エイトベース |

                                                今回の記事では、GASを使ってスプレッドシートにデータを書きこむやり方について解説します。 【GASでスプレッドシートのセルに書きこむ基本構文 】 GASでスプレッドシ…

                                                • 生成的モデル - Wikipedia

                                                  この項目では、統計的分類の文脈における生成モデルについて説明しています。マルコフ決定過程の生成モデルについては「en:Markov decision process#Simulator models」を、コンピュータグラフィックスにおける生成モデル言語(GML)と生成型コンピュータプログラミングについては「生成的モデリング言語(英語版)」を、生成AIについては「生成的人工知能」をご覧ください。 統計的分類では、生成的アプローチと識別的アプローチの2つの主要な手法がある。これらのアプローチでは、分類指標(英語版)を計算するために異なる方法論を用いており、その統計的モデリングの程度もさまざまである。使用される用語は一貫していないが[注釈 1]、Jebara (2004)によれば、主に3つの種類に分けられる。 生成的モデル(generative model)は、観測可能変数X と目的変数(英語版

                                                  • 疫学 医学的研究と実践のサイエンス

                                                    本書は、疫学で用いられる方法と、それを健康問題の解明や解決にどのように応用するかを解説するために書かれた入門書で、疫学の原理や方法について、豊富な公衆衛生上あるいは臨床医学上の事例を通して理解できるように配慮されています。 疫学 医学的研究と実践のサイエンス ―目次― 第I部 疾患と介入に対する疫学的アプローチ 第1章 はじめに 第2章 疾患拡大のダイナミクス 第3章 疾患の頻度を測定するI. 罹病 第4章 疾患の頻度を測定するII. 死亡 第5章 診断検査とスクリーニング検査の妥当性と信頼性の評価 第6章 疾患の自然経過:予後の表現方法 第7章 ランダム化比較試験:予防法および治療法の有効性の評価 第8章 ランダム化比較試験:その他のトピック 第II部 病因解明のための疫学的アプローチ 第9章 コホート研究 第10章 ケースコントロール研究とその他の研究デザイン 第11章 リスクの推定:

                                                      疫学 医学的研究と実践のサイエンス
                                                    • Volatility-constrained correlation を用いた金融市場間の影響伝播の解析

                                                      Recent financial crises have shown the importance of determining the directionality of the in uence between financial assets in order to identify the origin of market unstabilities. Here, we analyze the correlation between Japan's Nikkei stock average index (Nikkei 225) and other financial markets by introducing a volatility-constrained correlation metrics. The asymmetric feature of the metrics re

                                                      • 4つの円のベン図がかけない理由を超簡単に教えてください! - 以下の説明は、自分で紙に図を書いて手を動かしながら読むことを強くおススメし... - Yahoo!知恵袋

                                                        https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q13207326398 以下の説明は、自分で紙に図を書いて 手を動かしながら読むことを強くおススメします。 (こちらで図を投稿することも少し考えたけれど、 文字から図を起こす方が質問者さんの理解が深まります) まず、紙に円を1個かいてください。 円Aと呼ぶことにします。 Aは、 元からあった「紙の表面」(1領域)を、 「Aの内側」と「Aの外側」に分けました。(2領域) Aと交わるように、もう一つ円をかいてください。 円Bと呼ぶことにします。 Bは、 元からあった「Aの内側」を、 「Aの内でBの内」「Aの内でBの外」に 分けており、 さらに 元からあった「Aの外側」を、 「Aの外でBの内」「Aの外でBの外」に 分けています。 確認してください。 2領域が4領域に分けられました。

                                                          4つの円のベン図がかけない理由を超簡単に教えてください! - 以下の説明は、自分で紙に図を書いて手を動かしながら読むことを強くおススメし... - Yahoo!知恵袋
                                                        • 統計が勉強できるサイト

                                                          統計学を勉強してみようと本を探したりウェブサイトを探したりするとたくさん情報がでてきます。 「入門」と書いてあっても学問としての統計学が解説されており数式だらけで仕事にすぐに使えそうな内容が無かったりしませんか? 反対にもっとアカデミックに勉強したいんだけど、エクセルの関数を解説する統計サイトに出くわすことはありませんか? そんな人のために、学習の目的や自分の立ち位置から統計学が学べるサイトを探せるように整理してみました。 まずは気になるサイトを気軽に覗いてみてください。自分にあった学習方法を見つけることも勉強の効率化につながります。

                                                            統計が勉強できるサイト
                                                          • ”R”で実践する統計分析|回帰分析編:②重回帰分析【外部寄稿】 - GiXo Ltd.

                                                            Rによる回帰分析の実施手順を紹介 本日は、Rの使い方の実践として、「回帰分析」について紹介していきます。なお、回帰分析の理論については、こちらの特集内の【寄稿】回帰分析とその応用を参照ください。 『”R”で実践する統計分析|回帰分析編』は、全3回で、以下の構成で進めていきます。 回帰分析編 第1回:単回帰分析 回帰分析編 第2回:重回帰分析 回帰分析編 第3回:ロジスティック回帰分析 第2回の今回は「重回帰分析」を実践していきます。 Rによる重回帰分析 今回も、利用するデータは、回帰分析とその応用②~重回帰分析から拝借します。 * 出所: 柏木吉基(2006)『Excelで学ぶ意思決定論』(オーム社)p.94 上記のデータは、気象データとビール販売額が対となったデータですね。但し、今回は、気象データには、気温と湿度の2つがあります。つまりは、説明変数が2つあるわけです。単回帰分析は、説明変

                                                              ”R”で実践する統計分析|回帰分析編:②重回帰分析【外部寄稿】 - GiXo Ltd.
                                                            • 工場裏のアーカイブス

                                                              間が空いてしまいましたが(1)の続きとなります。こちらでは対応のある一元配置分散分析や、二元配置分散分析について纏めます。個人的な備忘録の色合いが強く、色々と端折っている部分があります。 ※環境はJupyter Notebookの想定です。 ※有意水準は全て5%(0.05)とします。 対応のある一元配置分散分析 使用するデータ statsmodelsを用いる方法 繰り返しのある二元配置分散分析 使用するデータ statsmodelsを用いる方法 対応のある一元配置分散分析 使用するデータ ここでは入門-統計学-第2版-という教科書171ページにある、対応のある一元配置分散分析の例題について、Pythonでトライしてみます。 こちらは2名の喫煙者Aさん、Bさんに対して、禁煙外来のカウンセリングが喫煙本数を変化させたかを検証する、という例題であり、以下の表がその結果となります。表内の数値は1日

                                                                工場裏のアーカイブス
                                                              • INTERVIEW 「最強」の統計家・西内氏が語るデータ分析を生かすために「煩悩」「とんち」が必要なワケ | HULFT Square

                                                                「最強」の統計家・西内氏が語る データ分析を生かすために「煩悩」 「とんち」が必要なワケ 2013年に発売された「統計学が最強の学問である」の著者である統計家・西内啓氏。シリーズ累計は50万部を超え、現在は企業のデータ活用支援や各種分析ツールの開発などビジネスの第一線で活躍しながら、分かりやすい言葉で統計学の魅力を語り続けている。そんな統計分野のスペシャリストである西内氏に、これまで歩んできたキャリアをはじめ、子育てなど日常世界にも生かせるデータ分析の魅力、そして企業のDX推進に欠かせない最適な人材像などについて詳しく伺った。 統計家・西内啓ができるまで 統計学の世界で様々な活動をされていますが、統計家になるまでの経緯について教えてください。 高校時代などは特別に将来の夢があったわけではなく、単に数学や物理が得意な理系タイプで、宇宙の謎を解き明かしたいというよりは「人間とは何か?」に興味を

                                                                  INTERVIEW 「最強」の統計家・西内氏が語るデータ分析を生かすために「煩悩」「とんち」が必要なワケ | HULFT Square
                                                                • 回帰分析における対数変換の意味を実感してみよう3 - 静粛に、只今統計勉強中

                                                                  前回、目的変数と説明変数を両方対数にして線形回帰モデルに当てはめたところ、信頼性のある結果が得られた、というお話をしました。 そこで、今回はその意味を考えてみたいと思います。 まず、通常の線形回帰について考えます。 平成22年の映画館従業者数を説明変数とし、スクリーン数を応答変数として推定された回帰式 では、従業者数が1人増えるごとにスクリーンが0.1064枚増える、従業者数が100人増えるごとにスクリーンが10.64枚増える、と予測されます。 つまり、マーカーが単に直線に近いところにプロットされるのではなく、比例関係を伴ってプロットされる、ということを想定しています。 しかし、実際の散布図では左下ほど密集していて、右上に行くにしたがって間隔が開いていくように見えます。 もしかすると上の図のように、もも指数関数的に増えるのかもしれません。 だとすれば、もも対数に変換してあげれば、比例関係の

                                                                    回帰分析における対数変換の意味を実感してみよう3 - 静粛に、只今統計勉強中
                                                                  • PCR検査推進側にもまだ誤解している方がいるかも?ギリギリ陽性は無い。ギリギリ陰性はある。正しく検査するためのノウハウについて(2020.7.23作成)

                                                                    ramos @ramos59454108 PCRの感度特異度デマはだいぶ減って来たと思うけど、もしかすると検査推進側にもまだ誤解があるのではと思うのでまとめる。 ①ギリギリ陽性←✕ ②全自動検査機←不要 ③迅速診断試薬の注意点 ramos @ramos59454108 ①ギリギリ陽性は間違え 何度か述べて来たけど、qPCRは定量技術だが、MIQEにもある通りウイルス診断分野では定量ではない。 ふつーの検査→検量線引いて測定。値を求めて定量 qPCR→検量線引いて測定。値を求めて、で? 出てきた値は例えばコロナ遺伝子1000個 ramos @ramos59454108 だから何?って突っ込まれる。何故かというと遺伝子抽出効率はサンプルによって劇的に違うからだ。入ってた細胞数も違う。 遺伝子という繊細なものを測定しようとしていることを理解して欲しい。 だから測定前に凄く厳密にtotalRNA濃

                                                                      PCR検査推進側にもまだ誤解している方がいるかも?ギリギリ陽性は無い。ギリギリ陰性はある。正しく検査するためのノウハウについて(2020.7.23作成)
                                                                    • 統計学の基礎である「基本統計量」についてわかりやすく解説

                                                                      それぞれ分類ごとに解説します。 統計データ可視化を成功させる95のチェックリストをダウンロードする 1.代表値(そのデータ全体を表す値) 小テストの点数のデータを使って解説します。 1-1.最小値(minimum) 最小値とはそのデータの中で最も小さな値のことです。 1-2.最大値(maximum) 最大値とはそのデータの中で最も大きな値のことです。 1-3.中央値(median) 中央値とはそのデータの真ん中の値を指します。データの個数が奇数の時、データのちょうど真ん中の値になり、データの個数が偶数の時、データの真ん中にある値2つの平均値になります。 1-4.平均値(mean) 平均値とは、全ての値を足して要素の数で割ったものです。 1-5.最頻値(mode) 最頻値とはそのデータの中で最もよく出現する値のことです。以下のデータの場合、2回出現している9点と16点が最頻値となります。 2

                                                                        統計学の基礎である「基本統計量」についてわかりやすく解説
                                                                      • ローズステークス2021はアンドヴァラナウトが重賞初制覇!

                                                                        馬連の払い戻しは¥15,130でした。 去年のローズステークスもリアアメリアが単騎逃げで スローペースに持ち込んで、逃げ切って勝っていて、 今年もエイシンヒテンが逃げ馬1頭で、楽に逃げれるのではと思って 馬券買ってたのが良かったです。 血統的には、中京芝2,000mならロベルト系、しかも去年は人気薄のエピファネイア産駒が来てるということで、 スパークル と コーディアル を厚めに買ってたんですが、 2頭とも来なかったです😭 エイシンヒテンの予想が当たったから よしとしましょうか。 ↓競馬ブログランキングに参加中です!

                                                                          ローズステークス2021はアンドヴァラナウトが重賞初制覇!
                                                                        • (2)はなぜ独立でもないのにかけるのですか?+ではないのでしょうか - Yahoo!知恵袋

                                                                          確率の積に独立かどうかは関係ありません。 Pₐ(B)を、事象Aが起こる条件の下Bが起こる条件付き確率とすると P(A∩B)=P(A)•Pₐ(B) これを、確率の乗法定理と言います。A,Bが独立のとき Pₐ(B)=P(B) より P(A∩B)=P(A)•P(B) これが所謂「積の法則」と呼ばれるものです。 確かに教科書等では積の法則について「独立のとき〜」などと書かれているので、貴方のように「掛け算するときは独立が条件」と誤解する方がたくさんいます。しかし、実際は独立でなくても掛け算はできます。 独立云々は掛け算かどうかの違いではなく、何と何を掛けるかの違いなのです。

                                                                            (2)はなぜ独立でもないのにかけるのですか?+ではないのでしょうか - Yahoo!知恵袋
                                                                          • 8-10 (β, 1-α)のグラフ ~ 帰無仮説・対立仮説・第1種の過誤・第2種の過誤|ネイピア eDAO

                                                                            統計的仮説検定のトピック「2種類の過誤」の確率を深掘りします。 難解な問題文章をグラフで紐解いて、第1種の過誤&第2種の過誤の確率に近づいて行きましょう! 公式問題集の準備 「公式問題集」の問題を利用します。お手元に公式問題集をご用意ください。 公式問題集が無い場合もご安心ください! 「知る」「実践する」の章で、のんびり統計をお楽しみください! 問題を解いて、知る今回の記事の構成 この記事は、通常の記事構成と違う章立てにいたします。 「問題を解く」「知る」「実践する」を1つの章にまとめます。 Pythonによるグラフを用いて、問題の直観的な理解に全集中します! 📘公式問題集のカテゴリ 検定の分野 問10 $${(\beta, 1-\alpha)}$$のグラフ(データ例無し) 試験実施年月 統計検定2級 2019年6月 問16(回答番号29) 📕公式テキスト:7.2.1 検出力と検出力関

                                                                              8-10 (β, 1-α)のグラフ ~ 帰無仮説・対立仮説・第1種の過誤・第2種の過誤|ネイピア eDAO
                                                                            • 勉強嫌いな「のび太」ほど、勉強はスマホでやったほうがいい 学力格差を解消する「スマ勉」の実力

                                                                              スマートフォンを使った「学習用アプリ」の利用が広がっている。スマホは本当に勉強の役に立つのだろうか。慶應義塾大学総合政策学部3年の土屋優介氏は「カンボジアの小学校で学習アプリの独自調査をした結果、学習意欲の低い生徒の意欲を高め、学力テストの点数を伸ばす効果があることが分かった。学力の底上げで、学力格差の緩和が期待できる」という——。 深刻化する生徒たちの「二極化」問題 インターネットなどの通信情報技術(ICT)を教育に活用し、紙と鉛筆が中心だった教育をアップデートしようという動きが世界的に広がっている。これは「エドテック」(EdTech)と呼ばれている。文字通り教育(Education)と技術(Technology)を組み合わせた造語だ。 こうした動きに合わせて、今、「学習アプリ」に熱い視線が向けられている。教員不足と言われる中、生徒一人ひとりの習熟度に合わせた「オーダーメイド教育」を実現

                                                                                勉強嫌いな「のび太」ほど、勉強はスマホでやったほうがいい 学力格差を解消する「スマ勉」の実力
                                                                              • 新型コロナ対策、「60%接触減」では1年経っても終わらない! 数学教育者が厚労省クラスター対策班のグラフを解説する « ハーバー・ビジネス・オンライン « ページ 2

                                                                                最近の報道番組等を見ていると一部ですが、最初のグラフが「感染者数」(先ほどのI(t)の値)と誤解して説明していらっしゃる方を見かけます。また、政治家の方にもいらっしゃいます。そのような方は、「なぜ、80%の接触減で感染者数がこんなに減るんだ」と発言されますが、「感染者数」はそんなに急には減りません。先ほどのグラフは「感染者数」ではなく、「『新規』感染者数」なのです。ですので、抑制措置をした30日目に(このモデルの理論上は)ガクンと減るのです。 一つ簡単な例で説明しましょう。29日目に感染者が1000人いたとして、何も流行対策をせずに30日目に感染者数が1100人になったとしましょう。この場合は先ほどのグラフには新たな感染者数として「100人」と記載されます。 しかし、80%の人が外出を控えれば、1000人の感染者のうち200人が外出し、この200人が感染者を20人増やしますので、グラフには

                                                                                  新型コロナ対策、「60%接触減」では1年経っても終わらない! 数学教育者が厚労省クラスター対策班のグラフを解説する « ハーバー・ビジネス・オンライン « ページ 2
                                                                                • 統計数値表の補間とは何? わかりやすく解説 Weblio辞書

                                                                                  t 表,ステューデント化された範囲の表,ダネットの表において,求めたい自由度が表にない場合には,自由度の逆数による補間法を用いる。 F 表の場合には,一方の自由度のみ補間する場合にも同じ公式が使用できる(両方の自由度を補間するときは二段階で補間する)。 注:χ2 表の場合には,直線補間(比例配分)でよい。 例題: 「t 分布表において,自由度が 43,両側確率が 0.05 になるようなパーセント点を求めなさい。」 計算手順: 求めたい自由度を νb,それを挟む 2 つの自由度を νa,νc とする (νa < νb < νc)。 例題では,νb = 43,νa = 40,νc = 60 である。 νa に対応する値 a,νc に対応する値 c を表から読みとる。 例題では,a = 2.021,c = 2.000 である。 νb に対応する値 b は,次式で求められる。 例題では,b = 2