1.判別分析とは 私たち人間は毎日五感を通じて入力される膨大なデータを処理している。その中で最も多いのは、識別(discrimination)、分類(classification)、認識(recognition)に関する処理である。例えば、新聞や本などを読むときには、視覚を通じて入力されたデータと学習したデータとの照合を行い、その文字の読み方、文字・単語の意味などを識別・認識する。識別に関する能力は人間のみならず、他の動物も持っている。 このような識別・認識に関することを機械的に実現する研究分野がパターン認識(pattern recognition)である。パターン認識の典型的な例としては、郵便番号による手紙の自動分類や指紋・顔照合によるセキュリティ管理などがあげられる。 パターン認識は、コンピュータに事前に入力・記憶させたデータと識別すべきデータとの一致度を何らかのモデルによって計算する
lda()関数と、predict()関数を使用して、線形判別分析を行ないます。 まず、線形判別分析行なうにあたり Rのデータセット iris から Species=”setosa” と “versicolor” に該当する1〜4列(変数群)のデータのみを 抽出して変数 data1 に格納します。 変数 data1 は以下のようになっています。(途中まで表示) 同様に、Rのデータセット iris から Species=”setosa” と “versicolor” の データに該当する5列目のデータ(Species)のみを抽出して 変数 grouping1 に格納します。 変数 grouping1 は以下のようになっています。(途中まで表示) データが準備できたので、線形判別を開始します。 最初に、MASSパッケージを読み込みます。 lda()関数を使用して、線形判別
Loading… Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here. NagoyaR_3_discriminant - Presentation Transcript Nagoya.R #3 (2010/06/19) R言語による判別分析入門 小林雄一郎 (大阪大学/日本学術振興会) 1 1. 判別分析とは 何らかの数学的な基準に基づいて、大量のデータを 複数のグループに分類する手法 目的変数(どんなグループに分類するか)と、 説明変数(何を手がかりに分類するか)を明確に 判別関数 y = a1 x1 + a 2 x 2 + … + a p x p + a 0
判別分析のモデル式は次のように表すことができる。 Sex = α + β1Height + β2Weight ここで従属変数Sexは2つのカテゴリをもつカテゴリカル型の変数であり、独立変数HeightとWeightは連続型の変数である。勘のいい人は気づいたかもしれないが、これは2値ロジットモデルとして解析されるべきモデルである。実際、表1のデータセットに対してロジスティック回帰分析を行っても問題なく、得られる結論も判別分析と同等であるといえる。これについては後述することにして、とりあえず判別分析モデルとして解析してみよう。 Rで判別分析を行うにはMASSパッケージに含まれているlda()という関数を用いる。 # MASSパッケージの呼び出し > library(MASS) # 身長・体重・性別のデータを用意する > Height <- c(177, 180, 175, 182, 170,
正準判別分析 Last modified: Jul 06, 2015 目的 正準判別分析を行う。 MASS パッケージにある lda は,3群以上の判別の場合には,正準判別分析を行っている。 そして,このプログラムも lda も,全く同じ答えを出す。 使用法 candis(data, group) print.candis(obj) summary.candis(obj) plot.candis(obj, pch=as.integer(obj$group), col=as.integer(obj$group)) 引数 data データ行列(行がケース,列が変数) group 各ケースがどの群であるかを表す変数 obj candis が返すオブジェクト 3 群以上の判別図 pch プロット記号(判別する群の数と同じ長さの整数ベクトル) col プロット色(判別する群の数と同じ長さの整
検定手順: ライアンの方法では,$k \times 2$ 分割表の比率の $\chi^2$ 検定の結果,全体として差が認められる場合にのみ対比較が行われる。 例題では,$\chi^2$ 検定統計量が $72.5872$(自由度 $= 4$)となる。有意確率は $0.001$ 未満であるから,全体として比率の差があるといえる。したがって,対比較によって,どの群間で差があるかを検討する。 前提 帰無仮説 $H_0$:「母比率に差はない」。 対立仮説 $H_1$:「母比率に差がある」。 有意水準 $\alpha$ で両側検定を行う(片側検定も定義できる)。 ライアンの方法では,名義的有意水準( $\alpha'$: nominal significant level )という概念が使われる。 群が $k$ 個あった場合,全ての 2 群の比率の差を検定するためには ${}_{k}C_{2}$ 回の
二群の比率の差の検定 Last modified: Apr 08, 2006 例題: 「内閣の支持率調査で,男の有権者の 300 人中 145 人,女の有権者 250 人中 157 人が支持していた。男女で支持率に差があるかどうか検定しなさい。」 注意:以下に述べるのは,正規分布を用いる近似的な検定方法である。「近似法」という意味は,「サンプルサイズが大きい場合には」という意味合いである。どの程度のサンプルサイズなら近似が成り立つのか心配ならば,サンプルサイズの大きさに関わりなくいつも正確な検定結果を与えるフィッシャーの正確検定を適用することを勧める。 検定手順: 記号の定義 第 $1$ 群のケース数を $n_1$,ある特性を持つものの数(陽性数と呼ぶことにする)を $r_{1}$,第 $2$ 群のケース数を $n_2$,陽性数を $r_{2}$ とする。 各群の比率を $p_{1
ギリシア神話によると、世界ははじめ、天と地と海とがぐちゃぐちゃに混ざり合ったかたまり だったんだそうだ。そこから最初にガイア(地球)が生まれた。大地の女神だ。 ガイアは4人の子供を生み、そのうちの1人ウラノス(天王星)と結婚。2人の間に生まれた たくさんの子供の中にクロノス(土星)が登場する。このクロノスは実はゼウス(木星)のお 父さんになるんだけど、ゼウスを含む6人の子供が生まれたときにいつか自分が子供に倒され るんじゃないかとこわがって、5人の子供を飲み込んじゃったんだそうだ(!)。 このときなんとか隠されて飲み込まれずに済んだ末っ子がゼウス。クレタ島でひっそりと大人 になったゼウスは、おばあちゃんのガイアに知恵を借りてお父さんだったクロノスをやっつけ 5人のきょうだいたちを吐き出させたんだそう。 ゼウスのきょうだいのうちの2人がハデス(冥王星)とポセイドン(海王星)、
シグモイド関数、ゴンペルツ曲線、ロジスティック曲線、ロジスティック回帰分析。オッズ比、ロジット 参照:JavaScriptの計算プログラム 生物の個体数、新製品の販売数、プログラムのバグ発見数など、当初は少なく、中途で大きくなり、その後また少なくなるような現象は多くあります。それを時間の推移と累積量をグラフにすると、下図のようになります。これを成長曲線といいます。 基本的な形式にシグモイド関数があります。 代表的な成長曲線に、ロジスティック曲線とゴンペルツ曲線があります。両者とも、似たようなS字型の曲線で、時間xが経つにつれ、増加が止まり一定値Kに近づきます。 その違いは、増加を規定する考え方、すなわち dy/dx にあります。 ロジスティック曲線 dy/dx = Ay (K-y) ゴンペルツ曲線 dy/dx = Ay e-cx 両者とも現在の個体数に比例して増加しますが、減少要因がロ
空間における方向関係を示すのに球面投影が便利であることは既に述べたが,これをさらに平面に投影するやり方の一つが,ここで解説するステレオ投影 stereographic projection である。いま,天頂Zに視点をおき,球面上の点Cを見たとする(図2)。Zを極とする大円,すなわち基円 primitive circle と視線との交点をC’とすれば,C’が求める投影点である。同様にして,大円ABCDはステレオ図上ではAB’C’Dで表される。このように天頂を視点とするやり方を下半球 lower hemisphere 投影といい,その反対に天底を視点とするやり方を上半球投影という(地球になぞらえて北半球投影・南半球投影と呼ぶこともある)。上半球投影は,鉱物学や岩石学で用いられるが,地質図学や構造地質学では傾斜やプランジを問題にすることが多いので,一般には下半球投影を用いる。以下,すべて下半球
今日から始めるデジカメ撮影術:第97回 一眼レフとボケの関係が人気になっていたので、もう少し詳しく「絞り値、シャッター速度、被写界深度の関係」を解説します。撮影の際、絞り値、シャッター速度を変えるとどのように被写界深度が変わり、どのようにボケ具合が変わるかは、実際に撮った写真を見てみるのが一番です。 というわけで、絞り値別に同じ被写体、同じ焦点距離で8枚の写真を撮りました。写真は「のだめカンタービレマングース」の口にピントを合わせて撮影しています。詳しい解説は後にするとして、まずは実写サンプルをどうぞ。(リサイズしたため、小さいサイズのままではわかりにくいので、各写真を画像クリックすることで大きな元画像が表示されます)
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く