タグ

rに関するzmsgnkのブックマーク (102)

  • kmeansで楽できる(かもしれない)パッケージを作った - yokkunsの日記

    k-means法は、非階層的クラスタリングの代表的な手法ですごく便利ですが、使って行く上で、以下の2つが問題になってきます。 初期値がランダムなので、結果がぶれる 最適なクラスタ数が分からない この2つの弱点に対して拡張版や手法が提案されていますが、すごくシンプルな方法で解決するパッケージを作ってみました。 その名もykmeansパッケージ・・・! http://cran.r-project.org/web/packages/ykmeans/index.html ※改良とか拡張とかしてるわけではないので、kmeans2とか付けるのは自重した このパッケージは、上記の二つの問題に対して、以下のアプローチで対応しています。 N回(デフォルトは100)実行して、一番分類されたクラスタを採用する 任意の変数のクラスタ内分散の平均値が小さくなるクラスタ数を採用する N回実行して一番多く分類されたクラ

    kmeansで楽できる(かもしれない)パッケージを作った - yokkunsの日記
  • 平滑化スプラインと加法モデル | Logics of Blue

    最終更新:2017年03月11日 Rを用いた平滑化スプライン・加法モデルの簡単な解説と計算・予測方法を載せます。 単回帰・重回帰分析との比較を交えて説明します。 ここで用いたRコードは、まとめてこちらから見ることができます。 コードは2015年8月30日に動作確認をしました。動かないものがあれば、ご一報いただければ幸いです。 スポンサードリンク 目次 1.平滑化スプラインと加法モデル 2.平滑化スプラインの仕組み 3.グネグネ度(平滑化パラメータ)を推定する 4.Rによる平滑化スプライン 5.線形? それとも非線形? 6.グネグネ度の決め方 7.モデルチェック 8.薄板平滑化スプラインと平滑化スプラインANOVA 9.加法モデルによる予測 ~重回帰との比較~ 1.平滑化スプラインと加法モデル 平滑化とはなんでしょうか。正確な定義ではありませんが、ものすごく簡単に言うと、「散布図にニョロニョ