タグ

ブックマーク / home.a02.itscom.net (4)

  • 主成分分析の基礎知識

    検索エンジンから直接きたひとは、フレーム目次が便利です。ここは 4章から入ります。 お急ぎで「主成分分析とは」を知りたい方は簡略版へどうぞ。 エクセルで層別散布図・等高線図を描きたい人は(おまけ)へ。 主成分といえば、むずかしそうに聞こえる。でももう君達は高校生のときに学校で教わっているのさ。 X軸とY軸の散布図を書いて、点々の真中ほどに直線を引いたろう?あれが第1主成分。 一番データの点々の広がった部分に直線を引いたはずだね。 第2主成分は、XとYの平均値(重心)を通って、第1主成分である直線に直角の線を引くと出来上がり。 主成分分析の計算過程を数学音痴向けに説明するね。 空中にまとまった点々があるから思い浮かべなさい。カトンボが空中を舞っている姿とか、子魚が群れをなして泳いでいる姿を思い浮かべるのじゃよ。 点々の分布が一番広がったところに、重心をとおってまず最初の直線を引きます。 フラ

  • (おまけ) イラストでわかる自由度と不偏分散 

    文に戻る (おまけ) イラストでわかる自由度と不偏分散 標準偏差を計算するときに、なぜデータ個数ではなく自由度 n-1 を使うの? そもそも自由度って何? というご質問を受ける。 標準偏差の計算と自由度の関係がわかりにくいということで、文にバラバラに書いてあるものを、そこだけまとめなおしてみました。 <不偏分散の公式> 平方和S 不偏分散V=━━━━━━━━ 自由度n-1 不偏分散は 標準偏差 2(σ 2)の最もよい推定値になっています。偏っていないという意味で不偏と名づけられています。いっぽう、平方和をデータ個数で割ると、真の標準偏差値より小さめの数値となります。 標準偏差とは何か (真の平均 μ で算出したとき) 標準偏差とは何かを知るために、まず面積の平均値を計算することからはじめよう。 Q: いろいろな大きさの正方形があります。この平均的な面積の正方形をどうやって描けば いい?

  • タコでもわかる主成分分析

    <BODY> <P>このページを表示するには、フレームをサポートしているブラウザが必要です。</P> <P>「主成分分析とは?」の初心者から、学会発表までの実務的内容を例をあげて説明しています。 <P><A HREF="tako01.html" TARGET="_blank">こちら</A>でみてね。</P> </BODY>

  • 重相関係数を知るための基礎知識

    サーチエンジンから直接入ってきた人は、フレームで目次を示していますからこれで目次表示にするとタコ国全体が見やすいです。目次からここへは 8 章から入ります。 自由度とは何かを知りたいかたは(おまけ)へ。イラストでの説明だよ。 「共分散とは」何かを知りたければこのイラストをじっとよくみて下さいね。 標準偏差とはデータの群があるときその「ばらつき」の指標です。平均値があるようなデータ群の場合には、データxを横軸に、そのデータの出現頻度を縦軸にすると、下の図のようにベル型の正規分布をします。平均値を中心にして含まれるデータ数が68%になるときの、平均値からのxの値(差分σ)を標準偏差といいます。 正規分布は、データ群によっていろいろな形があります。単位によっても分布の形状は変わります。たとえば、同じ物をはかっても長さをcmとmmと表した場合では異なる正規分布形状になります。 データを平均値をゼロ

  • 1