タグ

判別分析に関するsimakawaのブックマーク (7)

  • 判別分析

    2018.11.13 数理統計学演習 判別分析 東京大学大学院農学生命科学研究科 大森宏 http://lbm.ab.a.u-tokyo.ac.jp/~omori/kensyu/discriminant.htm 1.判別分析とは データを分類する手法である.分類のわかっているデータ(トレイニングデータ,教師データ)があり,データの属性値に基づいて,この分類を判別する手法である.機械学習の分野では,教師あり学習(supervised learning)と呼ばれている.データ分類手法として知られるクラスター分析は,分類がわかっていないので,教師無し学習(unsupervised learning)と呼ばれる. 応用分野は多岐にわたり,病気診断,スニップデータからの発現分類,スパムメールフィルター,などがあげられる. 2.2群の判別 2-1.空間の分割と判別規則 母集団が2つの部分母集団 A,B

  • 数量化Ⅱ類(質的データの多変量解析)

    数量化Ⅰ類 からの続き。 今回も「初歩からしっかり学ぶ 実習多変量解析入門」(以下、テキスト) のデータを用いた。 数量化Ⅰ類が「ダミー変数を使う重回帰分析」なのに対して 数量化Ⅱ類は、ダミー変数を用いる線形判別分析である。 Rによる統計解析 P.219 ...

    数量化Ⅱ類(質的データの多変量解析)
  • 統計学入門−第9章

    9.4 多変量の場合 (1) 多変量正規分布とマハラノビスの汎距離 次に変数が2つ以上の時の群の判別について考えてみましょう。 変数が1つの時はデータが正規分布すると仮定して尤度を求めました。 それと同様に、変数が2つ以上の時もデータが正規分布すると仮定して尤度を求めることができます。 ただしその場合の正規分布は普通のものではなく、変数が2つ以上あり、しかもその変数間に相関関係があると仮定した拡張正規分布であり、多変量正規分布(multivariate normal distribution)と呼ばれています。 多変量正規分布の式は恐ろしく複雑で、見たとたんに頭が痛くなるので(注1)を見ていただくとして、例えば変数が2つの時の姿は図9.4.1のような感じになります。 (注1) 変数が1つの時にデータのバラツキ具合を表す指標は偏差(xi - m)でした。 偏差はバラツキの指標であると同時に、

  • マハラノビスの平方距離

    第 2 群のデータは,第 1 群のデータを (100, 50) だけ平行移動したものである。 第 1 群の平均値は (59, 64),第 2 群の平均値は (159, 114) である。 > data1 X1 X2 1 7 8 2 30 28 3 60 29 4 28 55 5 57 60 6 77 62 7 69 77 8 55 94 9 96 93 10 111 134 > ( m1 <- colMeans(data1) ) # 第 1 群の平均値 群 X1 X2 1 59 64 > data2 X1 X2 1 107 58 2 130 78 3 160 79 4 128 105 5 157 110 6 177 112 7 169 127 8 155 144 9 196 143 10 211 184 > ( m2 <- colMeans(data2) ) # 第 2 群の平均値 X1

    simakawa
    simakawa 2013/11/17
     [マハラノビス距離] [discriminant]
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

    simakawa
    simakawa 2013/11/17
     [マハラノビス距離] [discriminant]
  • 判別分析

    数理統計学演習 判別分析 東京大学大学院農学生命科学研究科 大森宏 判別分析とは 2.2群の判別 2-1.空間の分割と判別規則 母集団が2つの部分母集団 A,B の混合からなっている場合を考える. 部分母集団 A,B の確率密度をそれぞれ fA(x ),fB(x ) とし,その混合比率をπA,πB とすると,母集団全体の確率密度は,

  • 判別分析

    simakawa
    simakawa 2013/11/16
     [相関比] [マハラノビス距離]
  • 1