一般化線形モデルや混合効果モデルなどはデータが何らかの確率分布にしたがうことを前提としてモデルを構築している。しかし、確率分布の仮定は問題によっては条件が厳しい場合もある。確率分布を意識せずにデータの回帰、あるいは判別のモデルを構築する方法としてツリーモデルがある。本章ではツリーモデルの概念、CART のアルゴリズム、CART の操作、いくつかの図示関数、木の生長とコントロール、木の剪定、回帰木などについて説明する。 1.ツリーモデルとは ツリーモデル (tree-based model) は回帰分析、判別分析を行う方法であり、回帰の問題では回帰木 (regression tree)、判別・分類の問題では分類木 (classification tree) あるいは決定木 (decision tree) とよばれている。 ツリーモデルは、説明変数の値を分岐させ、それらを組み合わせて、予測・判
仕事でC5.0とRandomForest、GBMを比較することがあったのでタイタニック号の生死判定をcaretパッケージでやってみた。 caretの使い方は以下を参考にさせて頂いた。 Tokyo r11caret from dichika 以下コード library(caret) data(Titanic) # Create Data tmp.titanic <- data.frame(Titanic) titanic <- data.frame( Class = rep(tmp.titanic$Class, tmp.titanic$Freq), Sex = rep(tmp.titanic$Sex, tmp.titanic$Freq), Age = rep(tmp.titanic$Age, tmp.titanic$Freq), Survived = rep(tmp.titanic$Surv
Author:統計とR勉強中 年齢:35歳 性別:男性 職業:会社員(データアナリスト) 統計、Rともに必死に勉強中! そのプロセスをブログにアップして、学習効率アップを狙ってます。。。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く