タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Rとデータ解析に関するknekokzのブックマーク (5)

  • きれいなディレクトリ構成でRプログラミング

    Rでコーディングするときに、データや単体テストのコード、ライブラリなどのディレクトリ構成を決めておくと、なにかと便利です。毎度、ディレクトリ構成が変わると設定をコードに書かないとならなくなり、保守が面倒になりますよね。Convention over configuration です。 Rで推奨されるような綺麗なディレクトリ構成を自動生成するライブラリを発見しました (自分で作ろうと思ったのですが)。その名も ProjectTemplate です。 では、インストールします。 $ sudo R install.packages('ProjectTemplate') 使ってみます。 $ R library('ProjectTemplate') create.project('myproject') setwd('myproject') load.project() 以下のようなディレクトリ構成

  • Random forests - classification description

    Random Forests Leo Breiman and Adele Cutler Random Forests(tm) is a trademark of Leo Breiman and Adele Cutler and is licensed exclusively to Salford Systems for the commercial release of the software. Our trademarks also include RF(tm), RandomForests(tm), RandomForest(tm) and Random Forest(tm). Contents Introduction Overview Features of random forests Remarks How Random Forests work The oob error

  • Random Forestで計算できる特徴量の重要度 - なにメモ

    (pixabay.comより) 1.背景とか Random Forest[1]とは、ランダムさがもつ利点を活用し、大量に作った決定木を効率よく学習させるという機械学習手法の一種です。SVMなどの既存の手法に比べて、特徴量の重要度が学習とともに計算できること、学習が早いこと、過学習が起きにくいこと(追記注釈1)などの利点が挙げられます。Kinectの姿勢推定に使われているらしいです。 最近、Random Forestをカジュアルに使う例が多く(特にうちの研究室)、一部パラメータやら出力やらがわからない人も多いと思います。使い方はTJOさんの資料[2]を読んでもらえれば理解できると思うし、詳細は波部先生の資料[3]をよんでもらえればわかると思います。 それで、いろいろな日語の資料をいくら読んでも、Random Forestがもつ特徴の1つである、特徴量の重要度の詳細に関してはほとんどノータッ

    Random Forestで計算できる特徴量の重要度 - なにメモ
  • 決定木 – 分類木 | トライフィールズ

    決定木とは、分類ルールを木構造で表したものである。分類したいデータを目的変数(従属変数)、分類するために用いるデータを説明変数(独立変数)という。目的変数がカテゴリデータなどの場合は「分類木」、連続値などの量的データの場合は「回帰木」と呼ばれる。 決定木の最大のメリットは、結果にグラフを用いることができるため、視覚的に確認できることである。 ここでは、R言語の「rpart」パッケージを用いて決定木について見ていこう。サンプルデータとして、Rに標準で含まれている「Titanic」を使わせていただいた。このサンプルデータはタイタニック号の乗客の属性情報と生死の情報が含まれている。生死を分けた要因を属性情報から分類するとどのようになるのかを見ていく。 まずは必要となるパッケージのインストールとロードを行う。「rpart」パッケージは決定木を行うためのものだが、「rpart.plot」と「part

  • 平滑化スプラインと加法モデル | Logics of Blue

    最終更新:2017年03月11日 Rを用いた平滑化スプライン・加法モデルの簡単な解説と計算・予測方法を載せます。 単回帰・重回帰分析との比較を交えて説明します。 ここで用いたRコードは、まとめてこちらから見ることができます。 コードは2015年8月30日に動作確認をしました。動かないものがあれば、ご一報いただければ幸いです。 スポンサードリンク 目次 1.平滑化スプラインと加法モデル 2.平滑化スプラインの仕組み 3.グネグネ度(平滑化パラメータ)を推定する 4.Rによる平滑化スプライン 5.線形? それとも非線形? 6.グネグネ度の決め方 7.モデルチェック 8.薄板平滑化スプラインと平滑化スプラインANOVA 9.加法モデルによる予測 ~重回帰との比較~ 1.平滑化スプラインと加法モデル 平滑化とはなんでしょうか。正確な定義ではありませんが、ものすごく簡単に言うと、「散布図にニョロニョ

  • 1