サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
画力アップ
norimune.net
先日,比治山大学で行われたHijiyama.Rで発表したスライドを,スライドシェアにアップしました。 内容は,タイトルの通り,Rのpsychパッケージで因子分析をするための方法についてまとめています。特に,SPSSなどの商用ソフトではできない,きめ細やかな分析法について触れています。 また,以下にスライドで使っているRコードをまとめて書いておきます。 library(psych) library(GPArotation) data(bfi) dat <- bfi[1:25] #MAPや情報量規準を推定できる summary(VSS(dat,n=10,use="complete.obs")) #平行分析のコード fa.parallel(cor(dat, use="na.or.complete"), n.obs = 2436, n.iter = 50) #リストワイズ削除したデータのサンプルサ
前回は、因子分析の因子抽出法について書きました。その続きになります。 因子軸の回転法は、大きく分けて2種類あります。 特定の回転基準を設定して、回転させる方法 他の因子負荷量行列を参考にして、それに最も近くなるように回転させる方法 おそらく多くの人は1.の方法を使っていると思います。2.の方法はあまり知られていないかもしれません。 今回は従来使われてきた回転法の解説に加えて、最新の方法についても触れます。 興味ある人は続きをどうぞ。 因子軸の回転方法とは 因子分析では、共通性を推定するだけでは因子負荷量は一意に定まりません。それはパラメータの制約が足りないからです。よってデータの適合とは別に、解を識別させるための基準を外的に導入するのが、回転法を用いる理由です。 しかし、その外的な基準といっても様々です。回転法の種類は、どういう制約を与えて解を定めるかという点で異なってくるわけです。 制約
平均値の差の検定における,等分散性の仮定 知っている人も多いと思いますが,二郡の平均値の差の検定(t検定)を行う時,群ごとの分散が等しいという仮定があります。 2群の分散が等しくない場合,検定結果は正しくなくなります。特に,サンプルサイズが両群で異なる場合,その傾向は顕著になります。このあたりについては,青木先生のサイトのシミュレーションが参考になります。 等分散性が成り立ってない場合,Welchの検定を用いることでただし検定結果を得ることができます。よく用いられる方法に,等分散性の検定を行って,もし等分散が成り立っていれば普通のt検定,成り立っていなければWelch検定という手続きがあります。しかし,これについても青木先生のサイトのシミュレーションが明らかにしているように,Welchの検定は等分散が成り立っていても成り立っていなくても常に正しい結果を出すので,常にWelchの検定を行うべ
HADについて HADは、主に心理統計分析を行うためのフリーソフトウェアです。 相関やクロス表などの基本的な統計解析から、分散分析・重回帰分析、因子分析,そして構造方程式モデル,混合分布モデルといった、心理学でよく用いられる多変量解析が可能です。また、級内相関係数や階層線形モデル,マルチレベルSEMなどの、マルチレベル分析も実行できます。 HADはMicrosoft ExcelのVBAで動いています。Excelのバージョンは2010以降で動作の確認をしています。Macでは、Excel for Mac 2016以降で動作を確認しています。 ※ただし、計算速度や動作の安定性はWindowsで動かしたほうよいです。できればWindowsでお使いください。 ・HADについての簡単な解説はこちらをどうぞ。 ・HADの機能一覧は、こちらからどうぞ。 ・HADのダウンロードはこちらからどうぞ。 ・HAD
先日,広島大学で「ベイズ推定による多変量解析入門」のというワークショップが行われました。 主催はDARMという広大の勉強会で,広島大学のポスドクの竹林君と広大院生の徳岡君が中心となって,開催されました。 会場には50人近くの人が,遠方からも来ていただいて,とても盛況でした。 ベイズの定理の話から,ベイズ統計,MCMCの基礎,そして多変量解析への実践にわたって,かなりの情報量があったと思います。 清水が発表したのは,MCMCでマルチレベルモデル,というもので,階層線形モデルをマルコフ連鎖モンテカルロ法で推定する,という話でした。 使ったソフトウェアはRとStanで,rsatnパッケージとglmer2stanパッケージを使いました。あと,Mplusについても少し触れています。 以下にスライドシェアにアップした資料を載せておきます。
因子分析をする場合、方法として抽出法と回転法を選択する必要があります。 しかし、様々な抽出法・因子軸の回転方法があり、かつ、それらがどういうアルゴリズムで計算されているのかわからないことも多いと思います。最近いろいろ質問を受けることが多かったので、今回は因子分析の各種方法について少し解説します。 因子分析は統計手法の発展やコンピューターの計算能力によって、オーソドックスとなる方法がいろいろ変ってきました。昔の論文の因子分析といえば、ほぼ主成分分析+バリマックス回転でした。この方法は計算量が少なく、ほぼ確実に解が求まることがメリットです。1日かけて計算して、解が求まらなかったら悲劇ですからね。 次の流行は主因子法+バリマックス、場合によってはプロマックス回転、という感じだったように思います。90年代あたりの論文は、まだプロマックス回転も少ないです。 最近は最尤法+プロマックス回転が主流でしょ
普段は自作の統計プログラムHADを使って分析していますが,人にいろいろ教えるときにはRも使っている清水です。 さて,今回はRで重回帰分析で交互作用を検討する方法について解説します。 昔,Rで重回帰分析で交互作用を検討するためのコードをアップしていたのですが,最近はもっと便利にできるパッケージがあるようです。というか僕が知らなかっただけか・・・ これについては,DARMという広大の院生・ポスドクが中心となってやっている勉強会のページで知りました(ここ)。まぁネタぱくってる,っていう話なんですけど(笑)。ぜひDARMのページも見てやってください。 ここでは,次のようなサンプルデータを使います。20しか見えませんが,200人のデータです。サンプルデータはこちらからダウンロードできます。 これを”dat”に読み込みます。 dat <- read.csv("sampledata.csv") まずは2
HAD11.3から,欠損値のあるデータを分析できるようになりました。 この記事では,欠損値の処理と,その推定方法について簡単に書きます。ただ,この記事は数式とかそういう話はないので,詳しいことを知りたい方は村山航さんの記事(PDFが開きます)や,広大の徳岡君の資料などを参考にしてみてください。これらはとてもよくまとまっていて,わかりやすいです。 欠損値の3つのタイプ 欠損値が生じる要因として,大きく分けて3つが考えられています(細かく言えばもっとある)。 データが,完全にランダムに欠損する データが,測定されている値に依存して欠損する(欠損データとは無関係) データが,欠損データに依存して欠損する 違いがちょっと分かりにくいですね。具体的に説明しましょう。 まず,データが完全にランダムに欠損するとは,データに反応しないのが,「たまたま」ということです。データになんにも依存していなくて,ほん
統計分析にはいろんな「仮定」があります。例えば,t検定はデータが正規分布である必要がある,などなど。しかし,仮定を満たさないからといって,その方法が全く使えなくなるとは限りません。 そこで,よく使われる統計手法の仮定と,それらに対する頑健さ,つまりどれぐらい逸脱を許容できるのかについてまとめておきます。 また,仮定の逸脱に対して脆弱なものにたいして,どのような対処が可能かについても書いておきます。 ただ,この記事で書いているいくつかの基準は,ただの目安なので盲目的に信じないでください。僕は統計の専門家ではないので,「ああ,そんな感じなのね」的に受け取ってもらえればと思います。 二群の平均値の差の検定(t検定) いわゆるt検定の仮定は,3つあります。 ・母集団が正規分布に従っている(母集団の正規性の仮定) ・二群の分散が等しい(分散の均一性の仮定) ・サンプルが独立に抽出されている(サンプル
この記事では,重回帰分析で交互作用を検討するとはどういうことか,ということを書きます。数学的な話はありません。またより詳しいことを知りたい場合は,前田先生のWebサイトを参照してください。 交互作用効果のおさらい 分散分析では,2要因以上の計画の場合,要因間の交互作用効果を検討することがあります。 交互作用効果とは,要因の効果が,別の要因によって変化することを指します。例えば,次のような例を考えてみましょう。 何人かの人にコーヒーと紅茶の好みをそれぞれ尋ねてみたとしましょう。日本だとコーヒーのほうが飲まれている頻度は多いように思うので,(推測ですが)おそらくこんな感じのグラフになるでしょう。 しかし,どちらかというと,コーヒーは男性が好きで,女性は紅茶のほうが好きなのかもしれません。このように,コーヒーと紅茶という飲み物の効果が,男性と女性で異なる,ということを考えるとそれは交互作用を考え
尺度を作った時など、因子分析で因子をいくつ抽出すればいいか悩むことがあるかと思います。 因子分析の因子数決定には、従来では以下のような基準が定番でした。 ガットマン基準:固有値が1以上の因子を採用する スクリー基準:固有値の大きさをプロットし、推移がなだらかになる前までを抽出する 寄与率が50~60%以上になる因子数を採用する 解釈が可能な因子構造を採用する 1のガットマン基準が最も使われていると思われますが、この方法は最近ではあまり良い方法とはみなされてはいないようです。もしデータが母相関行列であるならこの方法は適切ですが、実際のデータには誤差が含まれるので多すぎたり少なすぎたりする因子数を提案してしまいます。 この記事では、因子数決定に使える基準について述べます。 興味のある人は続きを読んでください。 因子分析は少数の因子によって、変数の相関関係を説明する方法です。 つまり、何因子用意
ベイズ推定って、最近はやってきてますね。僕も流行りにおいて行かれないように勉強しています。 理論的な話や数学的な話はいろいろWebや本をあされば出てきますが、実用面とか解釈面について言及しているものは少ないですね。 今回は清水の個人的な意見として、ベイズがどういう風に使えそうか書いてみます。数学的な話はなしで。よくわからないので。 興味ある人は続きをどうぞ。 2016/2/1追記:ベイズ統計について,入門的な資料を作りました。心理学者のためのベイズ統計入門もあわせてどうぞ。 ベイズ推定法の前に、従来法の代表として最尤推定法について触れておきます。 その方法とベイズがどう違うのかについて、そのあと述べます。 最尤推定法 最尤法ともいわれますが、基本的な発想は、モデルとデータの関係を次のように考えます。 真のモデルというのがあって、我々はそのモデルから発生したデータを手に入れている。真値は一つ
この記事では,カテゴリカル・データの相関係数である,ポリコリック相関係数について書きます。 カテゴリカルデータの相関係数 心理尺度でデータを測定した場合、5件法や7件法によるリッカート法を使うことが多いと思います。 リッカート法とは、ある質問について、当てはまる程度を1.まったく当てはまらない~5.非常に当てはまる、といった感じで5段階(場合によっては3段階や7段階など)で評定を求める方法です。 このようなリッカート法を使ってデータを収集する場合、得られた値を「間隔尺度」として扱って分析することがほとんどです。これはもちろん、間隔尺度のほうが扱える分析法が圧倒的に多いので、便利だからです。 しかし、心理学者の中でも、リッカート尺度は本来「順序尺度」なので、間隔尺度として扱うことに限界を感じている研究者も多いです。その理由としては、 値に与えられているラベル(まったく当てはまらない、など)間
関西学院大学社会学部 社会心理学研究室 清水裕士のWebサイトです。 ここでは清水裕士の研究活動について紹介します。 以下のようなカテゴリーの記事があります。 研究テーマ → 研究テーマや活動についての記録 心理統計学 → 主にベイズ統計学やマルチレベルモデルについて 統計ソフトHAD → 統計分析プログラムHADについて 清水ゼミ → 関西学院大学社会学部 清水ゼミについて 資料 → プログラムやレジュメなどの資料置き場 プロフィール → 自己紹介・研究内容など 業績 → 業績一覧 随時更新 リンク → 役立つサイトへのリンク 著書の紹介 『社会心理学のための統計学』 誠信書房 『個人と集団のマルチレベル分析』 ナカニシヤ出版
この記事では,媒介分析の方法についてまとめています。 媒介分析とは 媒介分析とは、二つの変数の間の因果関係を媒介する変数の影響を検討する方法です。 例えば、 X → Y というモデルを考えます。このとき、XがYに影響しているのですが、XとYの間に媒介変数Mを想定すると X → M → Y というモデルになります。 媒介モデルを検討することの利点は、XとYの関連をより精緻化させることができたり、擬似相関の解釈を回避できたりなど、いろいろあります。最近の社会心理学系の論文では頻繁に使われています。 当初はBaron & Kenny(1986)の論文で紹介されている重回帰分析を使った媒介分析が主に使われていたのですが、SEMの発展に伴ってそれもやや時代遅れとなってきました(基本的な発想は健在ですが)。また、媒介分析はいくつか注意するべき点があるので、今回はそれをまとめておきます。 媒介分析の手続
フリーの統計分析プログラムHADについて書いた記事です。 HADは,Excelで動くフリーの統計分析用プログラムです。基礎的な分析から統計的検定,そして分散分析,回帰分析,一般化線形モデル,因子分析,構造方程式モデル,階層線形モデルなどの多変量解析が実行できます。 HADを使った心理統計の本が出版されました! ◆HADとは HADについて説明しています。HAD利用前に、必ずこの記事を読んでください。 ◆HADのダウンロード ※リンク先をOneDriveに変えました。 もしリンクがつながらない場合や前のバージョンが欲しい場合は,清水まで連絡ください(simizu706あっとまーくnorimune.net)。 HADの使い方を習得するのに適したサンプルデータも用意しています。 ◆HADの利用についてよくある質問 HADについてよくある質問とその回答をまとめました。順次増やしていきます。 ◆HA
先日,HAD10.204をアップしました。そのときに新機能として搭載したのが,マハラノビス距離を用いた非階層クラスタ分析(以下,改良k-means法)です。 さて,この方法は,豊田・池原(2011;心理学研究)に掲載されたものです。従来のk-means法のアルゴリズムを改良して,より精度の高い手法となりました。アルゴリズムもとてもシンプルで,すぐにHADに実装できました。今回の記事は,この改良k-means法を紹介します。 k-means法ってそもそもなんぞや 最初に,k-means法について説明します。 クラスター分析には,階層クラスタ分析と,非階層クラスタ分析(SPSSでは大規模クラスタという名前)に分けることができます。 階層クラスタ分析は,クラスタに階層性を仮定しています。すなわち,下位のクラスタを統合して新しい上位のクラスタを作り,そのクラスタ同士をまた統合して・・・という感じに
心理統計やマルチレベルモデル、統計ソフトウェアについて書いた記事です。 HAD 清水が作ったフリーの統計分析用プログラムについての記事です。 エクセルで階層的重回帰分析,因子分析,分散分析,階層線形モデル,構造方程式モデル,混合分布モデルなど,その他いろんな統計分析ができます。 統計分析用マクロ HAD Stan ベイズ推定のためのソフトStanについて書いています。StanのWebサイトはこちら Stanについての記事一覧はこちら Stanの使い方についてまとめた記事は以下です。 Stan初級編 Stan中級編 回帰分析、因子分析など、心理学でよく使われる統計手法について書いています。 回帰分析について 重回帰分析で交互作用を検討する 重回帰分析を使って交互作用を見る場合の注意点 階層的重回帰分析をSEMでやる方法 媒介分析と間接効果の検討 一般化線形モデルについて 回帰分析の頑健な標準
このページを最初にブックマークしてみませんか?
『Sunny Side Up!: 関西学院大学社会学部 清水裕士のWebサイト』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く