Rのpsychパッケージを用いた,因子分析の方法についてまとめています。 特に,SPSSやSASなどの商用ソフトでは実行できない,多様な分析法がpsychを使えば可能になります。その辺りの分析方法について触れています。 具体的には,因子数の決定方法,因子の抽出,回転方法,カテゴリカル因子分析などです。
生存時間分析 ある時点から興味のあるイベントが起きるまでの時間とイベントとの間の関係に関する分析。 以下のような解析を行う 生存率の推定(Kaplan-Meier曲線) 2郡の生存率の比較 (Log-Rank検定) 生存率と共変量との関係の解明 (Cox回帰) また、イベントの例としては、以下のようなものがある。 機械システムや製品の故障 疾患の病気の再発や死亡 データの準備 ここでは、survivalパッケージにあるデータセットcolonを用いる。 colon : Stage B/Cの結腸癌患者を対象とした術後補助化学療法の比較臨床試験データ > library(survival) 要求されたパッケージ splines をロード中です > colon.OS <- subset(colon, colon$etype==2) #死亡に関するデータのみを取り出す Kaplan-Meier法によ
巨大地震が日本を襲い、皆不安を感じながら生活していると思います。 そんな中せめて自分に出来ることをしようと思い、研究してきた内容をブログに記します。 サンプル数が大規模なデータでニューラルネットワークとかサポートベクターマシンとかをしたくても、 時間がかかってしょうがない!ってときに参考にしてみて下さい。 近年、特にweb関係の業界ではデータデータをいくらでも記録できるようになったため、データの規模が非常に大きくなっています。 大規模データに機械学習、マシーンラーニングを適用したいという要望は高まっています。 そういうときはデータからサンプリングして性能を確かめることが多いと思います。 ですがそんな時は、 「サンプル数はどれくらいがいいの?」 「一回やっただけじゃ真の性能は分からないよね?」 「しかもクロスバリデーションしなきゃいけないし。。」 などのような事を疑問に思うでしょう。 今回紹
基礎外部スクリプトの読み込みRコンソールに一行ずつコマンドを入力してもいいけど、実際に使うにはテキストファイルにコマンドを書いて(ソースコード)一気に実行させる方が楽。 source('hogehoge.R') hogehoge.Rというのがソースコードを書いたファイル(ソースファイル)の名前。 ライブラリの追加CRANという、CPANのパクリがある。膨大な数のライブラリがあるので、好きなものをインストールするには、 install.packages('hoge',dependencies=TRUE) とするのが楽。 変数宣言不要。変数に使える文字も結構多い。日本語でもOK。 > あ<-1 > あ [1] 1 代入a<-1 b=2 1->a どれでもいい。但し推奨されてるのは一番上。Rの人は「束縛」という言葉を使いたがる傾向があるけど、どっちでもいいと思う。 余談だけど、関数の引数の中で代
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く