タグ

2017年3月23日のブックマーク (2件)

  • 多変数の相関を可視化する方法メモ - 草薙の研究ログ

    自分のためのメモ。 因子分析したら因子分析の結果だけ,構造方程式モデリングしたらパス図だけ,そういうのはちょっと好かない。殆どの場合相関行列があればそういうのは再現できるし,相関行列だって上手に可視化したら,例えば因子分析くらいの見通しはつく。これは,研究報告の透明性というのにもつながる。 ただ論文には紙幅の都合があって,いつでも,というわけにはいかないけど。 とにかく多変数の相関行列に対応するようなデータの可視化について,Rを用いてメモしていく。自分ですぐ忘れてしまうから。 (スクリプトの中に不自然に半角スペースとか入っているのは,hatena記法と変に被るところを避けるため) 散布図行列(SPLOM) 一番てっとり早い方法。 まずRのデフォルト関数で「データフレーム形式」でデータを読み込む。 例えばエクセルからクリップボードにコピーした状態なら, dat<- read="" table

    多変数の相関を可視化する方法メモ - 草薙の研究ログ
  • R 大量の変数間の相関行列を求め、有意で相関の高いペアのみ抽出する - Qiita

    目的 Rの標準で入っているライブラリlibrary(stats)の関数cor.testを使い、変数間の相関行列を求めます。 Rでは、変数のデータフレームを与えて一気に変数間の相関行列を出力させることが可能です。ですが変数が膨大にある場合、相関行列が出力されてもその読みとりは困難です。そこで、相関が強いと判定されたペアのみデータとして出力するスクリプトを作りました。 想定 「相関が強い」の閾値は、絶対値で0.4としています。 母相関係数の無相関の検定の有意水準は5%です。 アウトプットイメージ こんな感じになります(結果はダミーです)。 i列とj列:変数の列番号 cor: 相関係数 p_val : p値 データ準備 全ての列が量的な変数のデータ。 (factorの変数があれば、あらかじめ除去します) 変数ラベルリスト データとは別に変数ラベルリストを用意。 下記のvar_no は連番 ファイ

    R 大量の変数間の相関行列を求め、有意で相関の高いペアのみ抽出する - Qiita