[B! R] sonoshouのブックマーク

不均衡データのクラス分類(R Advent Calendar 2011) - sfchaos's blog

これは，R Advent Calendar 2011の担当分の記事です．機械学習やデータマイニングの実務への適用が脚光を浴びている今日この頃ですが，現実の問題に機械学習を適用する際は，パラメータのチューニング方法など様々な観点から検討を行う必要があります．今回は，クラス分類における不均衡データ(imbalanced data)の扱いについて考えてみます．不均衡データとはクラス分類を実行する際の悩みどころの一つとして，クラス分類の興味の対象となるクラスのサンプル数が他のクラスと比べて少ないケースがよくあることが挙げられます．このようなデータは不均衡データと呼ばれます．例えば，スパムメールかどうかの判別において，スパムであるサンプル数とスパムではないサンプル数．あるいは，ある重病に罹患する人を特定したい場合，その病気に罹患した人数と罹患していない人数．こうしたケースではクラス間でサンプ

sonoshou 2013/12/03

リンク

Rで計量時系列分析～CRANパッケージ総ざらい～

日本社会心理学会第6回春の方法論セミナー�「社会心理学者のための時系列分析入門」小森担当分．下記リンク「時系列地獄めぐりMAP.pdf」と一緒にご覧ください　https://drive.google.com/file/d/1mr73_49oTWHp7yiGrqUITOWQMTgaqmFi/view?usp=sharing

sonoshou 2013/10/11

リンク

主成分分析が簡単にできるサイトを作った - ほくそ笑む

あけましておめでとうございます。本年もよろしくお願いいたします。主成分分析さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。主成分分析は統計言語 R で簡単にできます。例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

sonoshou 2012/01/08

ウェブ上で主成分分析ができて、さらに結果をプロットしてくれる。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (6)

Rに関するsonoshouのブックマーク (3)

お知らせ

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

今週のはてなブックマーク数ランキング（2024年6月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス