タグ

判別分析に関するmahler-5のブックマーク (11)

  • データ解析・マイニングとR言語

    私たち人間は毎日五感を通じて入力される膨大なデータを処理している。その中で最も多いのは、識別 (discrimination)、分類 (classification)、認識 (recognition) に関する処理である。例えば、新聞やなどを読むときには、視覚を通じて入力されたデータと学習したデータとの照合を行い、その文字の読み方、文字・単語の意味などを識別・認識する。識別に関する能力は人間のみならず、他の動物も持っている。 このような識別・認識に関することを機械的に実現する研究分野がパターン認識 (pattern recognition) である。パターン認識の典型的な例としては、郵便番号による手紙の自動分類や指紋・顔照合によるセキュリティ管理などがあげられる。 パターン認識は、コンピュータに事前に入力・記憶させたデータと識別すべきデータとの一致度を何らかのモデルによって計算する。その

  • 統計学入門−第18章

    18.3 正準スコア (1) 正準スコアによる判別 第2節の正準関数を用いて被検者ごとの正準スコアを求め、さらに群ごとの正準スコアの平均値を求めると次のようになります。 ○第1正準スコア z1=0.4032238 + 0.7327189x1 + 1.0384614x2 - 1.2873219x3 + 0.4419487x4 - 0.2632886x5 x1〜x5:検査項目1〜検査項目5 正準スコア平均値:正常群 mz1N=1.49109 疾患A群 mz1A=-1.53817 疾患B群 mz1B=0.680132 ○第2正準スコア z2=-1.7750462 - 0.288767x1 - 0.2208574x2 + 0.0380198x3 + 0.4348566x4 + 0.1750495x5 正準スコア平均値:正常群 mz2N=-0.431886 疾患A群 mz2A=-0.105258  

  • 判別分析(マハラノビス)

    トップページ→研究分野と周辺→システムの評価→ 例えば二次元で考えると、x軸y軸平面に多数の点が散らばり、これが幾つかのグループに分かれているとする。判別分析では、新たな点が与えられたとき、どのグループに属するかを判別する。 判別分析には、幾つかの方法があり、「サポートベクターマシン(SVM)」のように区分する線を引く方法もある。 ここでは、マハラノビス距離を用いた判別分析について述べる。 マハラノビス距離 最も一般的に使われる距離はユークリッド距離である。一次元(例えばx軸上)では、x座標の差がそのまま距離となる。 例えば二つのグループがあるとき、新たな点が与えられてどちらのグループに属するかを判別する際、新たな点のx座標と双方のグループの中心とのユークリッド距離を測り、短い方に属すると考える事も出来る。 しかし、この方法では、以下のような場合に問題となる。 青い点と赤い点の二つのグルー

  • 判別分析とは|市場調査ならインテージ

    マーケティング用語集判別分析とは →【関連サービス】 データ解析サービス 「判別分析」とは、統計学上のデータ解析手法のひとつです。いくつかのグループ(群、カテゴリ)に分かれているデータを元に、それらが「どういう基準で分けられているのか」という関係を解析することで、分類されていないサンプルがどちらのグループに属するかを予測する手法です。 たとえば、ある商品の購入者・非購入者のデータを元に、どういう人がその商品を購入するのかを統計的に解析し、見込み客が購入するかどうかを予測する、といった場合に使われます。 判別分析は、判断材料や基準となるデータ、統計学的には「教師データ」と呼ばれるデータを基にした分析です。もともとは海外でR. A. Fisher が多変量分散分析のアイデアをベースに応用した分析手法ですが、日では第二次世界大戦後の混乱で刑務所があふれそうになった際、釈放する人を決めるために再

  • 数量化Ⅱ類

    判別分析+ 心理データ解析演習 2013/6/19 M1 宮坂まみ  Why 数量化理論? 数量化理論の誕生 2   林知己夫を中心として発展した  多変量解析の理論  林知己夫; 1974-1986年 統計数理研究所七代所長 3 数量化理論のプロフィール (統計数理研究所HPより)   サンプリング調査を勉強することになった林先生。  「標を増やせば必ず差が出るので,やらなくても分 かっていると感じたのである。」  「世の中には,“数学的に同じ”,“相関係数0”,“数 学的に独立なもの”は存在すると考える方がおかしいの である。しかし,これが統計的仮説の土台となっている のである。」  「このあたりで,従来から持っていた私の“データ”な るものを大事にする考え方が私の志向する統計学の中で 固まりかけてきた。つまり,“データによる現象解析の ための統計的方法(データ

  • R -- 判別分析(ステップワイズ変数選択)

    判別分析(ステップワイズ変数選択)     Last modified: Aug 25, 2009 目的 ステップワイズ変数選択による判別分析を行う 使用法 sdis(data, group, stepwise=TRUE, P.in=0.05, P.out=0.05, predict=FALSE, verbose=TRUE) 引数 data 説明変数だけのデータフレーム group 群を表す変数(ベクトルではなく,1 列のデータフレームとして引用するほうがよい) stepwise ステップワイズ変数選択をするかどうか(デフォールトは TRUE) P.in Pin(デフォルトは 0.05) P.out Pout(デフォルトは 0.05,Pout ≧ Pin のこと) predict 個々の判別結果などを出力するかどうか(デフォルトは FALSE) verbose ステップワイズ変数選択の途中

  • 判別分析

    2018.11.13 数理統計学演習 判別分析 東京大学大学院農学生命科学研究科 大森宏 http://lbm.ab.a.u-tokyo.ac.jp/~omori/kensyu/discriminant.htm 1.判別分析とは データを分類する手法である.分類のわかっているデータ(トレイニングデータ,教師データ)があり,データの属性値に基づいて,この分類を判別する手法である.機械学習の分野では,教師あり学習(supervised learning)と呼ばれている.データ分類手法として知られるクラスター分析は,分類がわかっていないので,教師無し学習(unsupervised learning)と呼ばれる. 応用分野は多岐にわたり,病気診断,スニップデータからの発現分類,スパムメールフィルター,などがあげられる. 2.2群の判別 2-1.空間の分割と判別規則 母集団が2つの部分母集団 A,B

  • Notebook

  • 判別分析モデルの応用

    判別分析のモデル式は次のように表すことができる。 Sex = α + β1Height + β2Weight ここで従属変数Sexは2つのカテゴリをもつカテゴリカル型の変数であり、独立変数HeightとWeightは連続型の変数である。勘のいい人は気づいたかもしれないが、これは2値ロジットモデルとして解析されるべきモデルである。実際、表1のデータセットに対してロジスティック回帰分析を行っても問題なく、得られる結論も判別分析と同等であるといえる。これについては後述することにして、とりあえず判別分析モデルとして解析してみよう。 Rで判別分析を行うにはMASSパッケージに含まれているlda()という関数を用いる。 # MASSパッケージの呼び出し > library(MASS) # 身長・体重・性別のデータを用意する > Height <- c(177, 180, 175, 182, 170,

  • NagoyaR_3_discriminant

    Loading… Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here. NagoyaR_3_discriminant - Presentation Transcript Nagoya.R #3 (2010/06/19) R言語による判別分析入門 小林雄一郎 (大阪大学/日学術振興会) 1 1. 判別分析とは 何らかの数学的な基準に基づいて、大量のデータを 複数のグループに分類する手法 目的変数(どんなグループに分類するか)と、 説明変数(何を手がかりに分類するか)を明確に 判別関数 y = a1 x1 + a 2 x 2 + … + a p x p + a 0

  • Google Sites: Sign-in

    Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode

    Google Sites: Sign-in
  • 1