タグ

ブックマーク / www.snap-tck.com (8)

  • 統計学入門−第9章

    この章では判別分析の原理と結果の解釈方法、診断率との関係、そして各種の変数選択手法とロジスティック曲線について解説します。 9.1 判別分析の原理 (1) 群の判別 判別分析(discriminant analysis)は重回帰分析と並んで利用頻度の高い多変量解析手法です。 この手法は各種のデータに基いて人や物などを特定の群に判別したり、判別に影響を及ぼすデータを探索したりする時に用いられます。 例えば虚血性心疾患患者群と正常群について各種のデータが測定されている時、そのデータに基いてある人が虚血性心疾患であるかどうか診断したり、虚血性心疾患の診断に影響を与える検査項目を探索したりする時がこれに相当します。 そのため病気の診断を必要とする医学分野では、重回帰分析よりもむしろ有用性の高い手法と言えるでしょう。 第6章 表6.1.1の脂質異常症患者についてのTCとTGのデータを動脈硬化症患者に

  • ベクトルと行列 ベクトルと行列の演算例

    3.ベクトルと行列の演算例 1) ベクトルと行列を利用した演算例 さて、数式の羅列に頭が痛くなったところで、ベクトルと行列の演算を利用してケーキを作る時の費用について具体的に計算してみましょう。 まず最初に小麦粉200グラムだけを使って、味気ないケーキを作るとします。 小麦の単価が1グラム0.1円だとすると、ケーキの費用は次のように計算できます。

  • 統計学入門−目次

    最終更新日:2022年08月24日 前口上へ 第1章へ webmaster@snap-tck.com Copyleft (C) 2000 SNAP(Sugimoto Norio Art Production)

  • ベクトルと行列

    最終更新日:2004年4月1日 第1章へ webmaster@snap-tck.com Copyleft (C) 2000 SNAP(Sugimoto Norio Art Production)

  • 雑学コーナー

    ●統計学入門 ——あなたにも統計学がわかる!……かもしれない—— 2021年07月07日 データ解析屋という商売柄、統計学に関する研修や勉強会の講師役を頼まれることがあります。 そのための適当な教科書を探したんですが、なかなかこれといったがなく、仕方なく自分でしこしこと書き下ろすことにしました。 コンセプトは「統計学を利用する科学現場の研究者のために、できるだけ数式を使わず、できるだけわかりやすく」というもので、わかりやすさのためには正確さを多少犠牲にしてもかまわないという方針でいくことにしました。 統計学に興味のある方はちらっと覗いてみてください。 ●ワクチンの有効性と安全性 2021年03月16日 急性呼吸器症候群COVID-19用のワクチンが続々と開発され、その臨床試験の結果が公表されつつあります。 そこでファイザー(Pfizer)とバイオンテック(BioNTech)が開発した、m

  • 統計学入門−第2章

    全体:Mann-WhitneyのU検定 zo = 2.052 * (p = 0.0402) 改善率(軽度改善以上を改善とした時):χ2検定(2x2) χo2 = 4.010 * (p = 0.0452) この表を度数分布図にすると次のようになります。 第1節で説明したように、レベルの高い尺度のデータをレベルの低い尺度のデータに変換することを尺度合わせといいます。 表2.6.1の改善率は順序分類尺度である改善度を改善と非改善に2分類して名義尺度に変換したもので、尺度合わせの典型的な例です。 軽度改善以上を改善にしたということは、著明改善も中等度改善も軽度改善も医学的な意義は全て同じで、ひっくるめて改善と考えられ、同様に不変も悪化も医学的な意義は全て同じで、ひっくるめて非改善と考えられるという判断をしたことに他なりません。 (→2.1 データの種類と統計手法) 確かにそのように考えた方が良い時

  • 統計学入門

    さて皆さん、「数字は魔物、統計は数字のトリック」などと言われ、統計学はある人々からは疫病神のように忌みに嫌われ、またある人々からは金科玉条のごとく無条件に信奉され、はたまた別の人々からは塵芥のごとく無視されています。 しかしやかましくいわれている割には、その質が十分理解されているとはいい難いのが現状ではないでしょうか? 研究現場の研究者が統計手法を利用する時に犯す間違いのうち、ほぼ90%のものが非常に初歩的なものです。 そしてそれらの間違いは研究者が統計学の基的な事柄をはっきりと理解していないか、あるいはそれらを誤解していることが原因になっています。 例えば研究現場でしばしば間違って使われている統計手法のベスト3は次のようなものです。 有意確率(p値)と「有意差あり」の意味 標準偏差(SD)と標準誤差(SE)の使い分け 多重比較の使用方法 これらは全て非常に初歩的かつ基的なことです。

  • 統計学入門−第9章

    9.4 多変量の場合 (1) 多変量正規分布とマハラノビスの汎距離 次に変数が2つ以上の時の群の判別について考えてみましょう。 変数が1つの時はデータが正規分布すると仮定して尤度を求めました。 それと同様に、変数が2つ以上の時もデータが正規分布すると仮定して尤度を求めることができます。 ただしその場合の正規分布は普通のものではなく、変数が2つ以上あり、しかもその変数間に相関があるということを考慮した拡張正規分布であり、多変量正規分布(multivariate normal distribution)と呼ばれています。 多変量正規分布の式は恐ろしく複雑で、見たとたんに頭が痛くなるので(注1)を見ていただくとして、例えば変数が2つの時の姿は図9.4.1のような感じになります。 (注1) 変数が1つの時にデータのバラツキ具合を表す指標は偏差(xi-m)でした。 偏差はバラツキの指標であると同時に

  • 1