概要 「固有値問題」の応用の1つとして、主成分分析を紹介。 記号の準備 これから説明する主成分分析は、 N 個のベクトル x1 , x2 , ・・・, xN に対して、その線形結合
因子分析: Factor Analysis 兵庫教育大学 成田 滋 Updated January 6, 1998 [心理・教育のための統計の初歩][論文の書き方] [偏相関分析について][多変量解析は強力で難しくない] [ノンパラメトリック法による分散分析の方法 --Friedman][直線的関連 Correlation] [データの性質と反復測定データ: Repeated Mesurement][ 共分散分析について][データの性質を知ろう][クラスター分析: Cluster Analysis][判別分析: Discriminant Analysis][重回帰分析: Multiple Regression Analysis] はじめに 世の中では、いろいろなアンケート調査が行われます。新しい製品がどんな消費者に人気があるのか、どの店の売り上げが高いのか、どの政党
多変量解析 多変量解析とは、多数の変数で表現されているデータから情報を要約する為の統計手法である。多変量解析には様々な手法が存在するが、Visual Mining Studioには、対応分析、主成分分析、Kernel主成分分析、主成分得点判定が実装されている。これらの分析は、情報損失をなるべく少なくするような少数の合成変数で、全体としてのデータの構造や情報を表現する手法である。Feature Selectionでは変数を選択することで次元を下げる事を行ったが、これらの手法は変数を合成することで情報を圧縮する手法である。 これらの分析は、データを少数の変数で表現することが出来るので、それを可視化することでデータの構造を把握することが可能である。また、データを少数の変数で表現できるので、その後の分類分析やクラスター分析等を効率よく行うことが可能である。 以下にVisual Mining
※ このコンテンツは「エクセル統計(BellCurve for Excel)」を用いた解析事例です。 分析データ 下図は、2008年8月に行われた北京五輪における陸上10種競技の結果から4種目だけ抜き出したものです。26選手について10種の競技(100m、走り幅跳び、砲丸投げ、走り高跳び、400m、110m障害、円盤投げ、棒高跳び、やり投げ、1500m)のデータが得られましたが、サンプルサイズに対して変数の数が多い場合は解析に注意が必要なため、100m、400m、110m障害、1500mの4種目のデータを抜き出しました。データは各選手の競技別の得点そのもので、10種目の合計得点の高い順に並べられています。 ダイアログの設定 まず、データ範囲のラベルを選択します。データラベルのラベル「選手」(C3)を選択後、[Ctrl]キーを押しながら4種目のラベル「100m」「400m」「110m障害」「
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く