タグ

Rに関するhayato34のブックマーク (6)

  • 「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11

    Rのpsychパッケージを用いた,因子分析の方法についてまとめています。 特に,SPSSやSASなどの商用ソフトでは実行できない,多様な分析法がpsychを使えば可能になります。その辺りの分析方法について触れています。 具体的には,因子数の決定方法,因子の抽出,回転方法,カテゴリカル因子分析などです。

    「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
    hayato34
    hayato34 2011/11/27
    randomforest
  • RHIPE徹底入門

    HadoopをRから効率良く使用可能なパッケージであるRHIPEについてインストールから使用方法まで簡単に説明しています。

    RHIPE徹底入門
    hayato34
    hayato34 2011/11/27
    R言語にて手軽にMapReduceを記述するためのパッケージ
  • How to Plot "Reverse" Cumulative Frequency Graph With ECDF

  • [R]R言語で生存時間分析 - yokkunsの日記

    生存時間分析 ある時点から興味のあるイベントが起きるまでの時間とイベントとの間の関係に関する分析。 以下のような解析を行う 生存率の推定(Kaplan-Meier曲線) 2郡の生存率の比較 (Log-Rank検定) 生存率と共変量との関係の解明 (Cox回帰) また、イベントの例としては、以下のようなものがある。 機械システムや製品の故障 疾患の病気の再発や死亡 データの準備 ここでは、survivalパッケージにあるデータセットcolonを用いる。 colon : Stage B/Cの結腸癌患者を対象とした術後補助化学療法の比較臨床試験データ > library(survival) 要求されたパッケージ splines をロード中です > colon.OS <- subset(colon, colon$etype==2) #死亡に関するデータのみを取り出す Kaplan-Meier法によ

    [R]R言語で生存時間分析 - yokkunsの日記
    hayato34
    hayato34 2011/05/01
    生存時間分析
  • 大規模データマイニングでのモデル探索手法:K-sample plot - データサイエンティスト上がりのDX参謀・起業家

    巨大地震が日を襲い、皆不安を感じながら生活していると思います。 そんな中せめて自分に出来ることをしようと思い、研究してきた内容をブログに記します。 サンプル数が大規模なデータでニューラルネットワークとかサポートベクターマシンとかをしたくても、 時間がかかってしょうがない!ってときに参考にしてみて下さい。 近年、特にweb関係の業界ではデータデータをいくらでも記録できるようになったため、データの規模が非常に大きくなっています。 大規模データに機械学習、マシーンラーニングを適用したいという要望は高まっています。 そういうときはデータからサンプリングして性能を確かめることが多いと思います。 ですがそんな時は、 「サンプル数はどれくらいがいいの?」 「一回やっただけじゃ真の性能は分からないよね?」 「しかもクロスバリデーションしなきゃいけないし。。」 などのような事を疑問に思うでしょう。 今回紹

    大規模データマイニングでのモデル探索手法:K-sample plot - データサイエンティスト上がりのDX参謀・起業家
  • R基礎文法最速マスター

    基礎外部スクリプトの読み込みRコンソールに一行ずつコマンドを入力してもいいけど、実際に使うにはテキストファイルにコマンドを書いて(ソースコード)一気に実行させる方が楽。 source('hogehoge.R') hogehoge.Rというのがソースコードを書いたファイル(ソースファイル)の名前。 ライブラリの追加CRANという、CPANのパクリがある。膨大な数のライブラリがあるので、好きなものをインストールするには、 install.packages('hoge',dependencies=TRUE) とするのが楽。 変数宣言不要。変数に使える文字も結構多い。日語でもOK。 > あ<-1 > あ [1] 1 代入a<-1 b=2 1->a どれでもいい。但し推奨されてるのは一番上。Rの人は「束縛」という言葉を使いたがる傾向があるけど、どっちでもいいと思う。 余談だけど、関数の引数の中で代

    R基礎文法最速マスター
    hayato34
    hayato34 2011/02/12
  • 1