タグ

ブックマーク / aoki2.si.gunma-u.ac.jp (14)

  • R -- 総当たり法による重回帰分析

    総当たり法による重回帰分析     Last modified: Aug 27, 2009 目的 総当たり法による重回帰分析を行う。 使用法 All.possible.subset.selection(df, limit) print.All.possible.subset.selection(obj, sort.by=c("adj", "rsq", "AIC"), models=20) 引数 df データフレーム(従属変数を最後の列に置く) limit 独立変数の個数の制限値。標準では 10 個 注意:独立変数が多いと莫大な計算時間がかかり,出力行数も増える 独立変数が1個増えるだけで,計算時間はほぼ 2 倍になり,出力行数は 2 倍になる obj sort.by モデルの適否を表す3種の統計量のどれでソートして結果を表示するかの選択 デフォルト("adj")では 結果を自由度調整済み重

    syou6162
    syou6162 2008/06/18
  • R -- プログラミングの定石

    syou6162
    syou6162 2007/10/10
  • R -- 度数分布表と度数分布図の作成

    度数分布表と度数分布図の作成     Last modified: Dec 12, 2012 目的 データフレーム上の複数の変数を指定して,度数分布表と度数分布図を作成する。 数値変数かカテゴリー変数かを識別して,適切な度数分布表とヒストグラムまたは棒グラフを作成する。 使用法 frequency(i, df, latex=TRUE, captions=NULL, labels=NULL, output="", output="", encoding=getOption("encoding"), plot="", type=c("pdf", "png", "jpeg", "bmp", "tiff"), width=500, height=375, xlab=NULL, ylab="度数", main="") 引数 i データフレーム上で,度数分布をする変数が入っている,列の番号または変数名

  • R -- クロス集計

    クロス集計     Last modified: Dec 12, 2012 目的 データフレーム上の複数の変数を指定して,クロス集計を行い,必要ならば独立性の検定,フィッシャーの正確検定,コルモゴロフ・スミルノフ検定の何れかを行う。 使用法 cross(i, j, df, row=TRUE, latex=TRUE, captions=NULL, labels=NULL, test=c("none", "chisq", "fisher", "kruskal"), output="") 引数 i, j データフレーム上で,クロス集計をする二変数が入っている,列の番号または変数名ベクトル i は表側に来る変数,j は表頭に来る変数 i, j は,それぞれベクトルでもかまわない。i の要素と j の要素のすべての組み合わせでクロス集計を行う df 読み込んだデータフレームの名前 row デフォルト

  • R -- 主成分分析(prcomp を援用)

    主成分分析(prcomp を援用)     Last modified: Dec 08, 2005 目的 R には,princomp および prcomp という,二種類の関数が用意されている。 しかし,これらが返す「loadings」は固有ベクトルそのものであって,いわゆる負荷量ではない。 ここに示す関数は,prcomp を下請け関数として用いて,通常の主成分分析結果として提示するものである。 なお,pca という関数も書いたので,そちらも参照してみるとよい。 使用法 prcomp2(dat, pcs=0, cor=TRUE, verbose=TRUE) 引数 dat データ行列(行がケース,列が変数) pcs 求める主成分の個数。 0 を指定する(デフォールト)と固有値が 1 以上の主成分を求める。 cor TRUE(デフォールト)の場合には相関係数行列を主成分分析する(変数の単位に異

  • R -- 主成分分析(princomp を援用)

    主成分分析(princomp を援用)     Last modified: Jul 29, 2004 目的 R には,princomp および prcomp という,二種類の関数が用意されている。 しかし,これらが返す「loadings」は固有ベクトルそのものであって,いわゆる負荷量ではない。 ここに示す関数は,princomp を下請け関数として用いて,通常の主成分分析結果として提示するものである。 なお,pca という関数も書いたので,そちらも参照してみるとよい。 使用法 princomp2(dat, pcs=0, cor=TRUE, scores=FALSE, verbose=TRUE) 引数 dat データ行列(行がケース,列が変数) pcs 求める主成分の個数。 0 を指定する(デフォールト)と固有値が 1 以上の主成分を求める。 cor TRUE(デフォールト)の場合には相関

    syou6162
    syou6162 2007/01/31
    あとで試す→試した。引数とか戻り値の説明が載っていて非常に分かりやすい。
  • R -- 因子分析

    因子分析     Last modified: Aug 31, 2009 目的 因子分析を行う。 R には factanal という関数が用意されている。最尤法により因子を求めプロマックス回転するならそれを利用すべきである。 factanal を使いやすくする関数(factanal2)を作ったので参照されたい。 使用法 pfa(dat) pfa(dat, method=c("Varimax", "biQuartimax", "Quartimax", "Equimax", "None"), eps1=1e-5, eps2=1e-5, max1=999, max2=999, factors=0) print(result, before=FALSE) plot(result, before=FALSE, fac.no=1:2, scores=FALSE, xlab=NULL, ylab=NUL

    syou6162
    syou6162 2007/01/31
    あとで試す
  • R -- 主成分分析

    主成分分析     Last modified: Aug 02, 2009 目的 主成分分析を行う。 R には,princomp および prcomp という,二種類の関数が用意されている。 しかし,これらが返す「loadings」は固有ベクトルそのものであって,いわゆる負荷量ではない。 そこで,princomp2,prcomp2 という関数を書いたので,そちらも参照してみるとよい。 使用法 pca(dat) print.pca(obj, npca=NULL, digits=3) summary.pca(obj, digits=5) plot.pca(obj, which=c("loadings", "scores"), pc.no=c(1,2), ax=TRUE, label.cex=0.6, ...) 引数 dat データフレームまたはデータ行列(行がケース,列が変数) obj pca

    syou6162
    syou6162 2007/01/31
    あとで試す
  • R -- 塗り分け地図を描く

    塗り分け地図を描く     Last modified: Oct 31, 2006 目的 塗り分け地図を描く (単なる白地図も描けるが,その場合には map.draw でもよい) 使用法 map(code, density, color) ただし,このままでは場合によっては使いにくいので,いくつかのレディー・メードの関数(ラッパー;上位関数)を用意している。 引数 code 描画する都道府県コード(1:北海道〜47:沖縄まで) density ハッチングの 1 インチあたりの密度 color 色の指定 density と color の要素数は,描画する都道府県の数(code の要素数)と同じ個数でないといけない density, color を両方とも省略すると,白地図 density のみを指定すると,モノクロのハッチングによる塗り分け地図 color のみを指定すると,その色での塗り

  • R -- 地図を描く

    地図を描く     Last modified: Oct 21, 2004 目的 地図を描く 使用法 draw.map(fn) 引数 fn 地図情報データファイル データファイルには,一行に境界データ(経度と緯度の座標値(正数))が記述されている 一連の境界データは,経度・緯度がともに 0 であることで区切りとする (あとで NA に置き換え,そのまま plot 関数により境界を描画する) ソース インストールは,以下の 1 行をコピーし,R コンソールにペーストする source("http://aoki2.si.gunma-u.ac.jp/R/src/draw_map.R", encoding="euc-jp") # 境界線データに基づいて白地図を描く draw.map <- function(fn) # 境界線データのあるファイル名 { data <-read.table(fn, h

  • 因子分析

    因子分析     Last modified: Aug 07, 2003 因子分析は,多変量データから潜在的ないくつかの 共通因子 を推定する手法である。 例題: 「」 多因子モデル 因子の求め方 因子軸の回転( 直交回転 ) 因子軸の回転( 斜交回転 ) 因子得点係数の求め方 因子得点の求め方 相関係数行列の吟味 補足説明 使用例 演習問題: 応用問題: 統計学自習ノートへ戻る 計算プログラム [CGI(C)] [R] [Python] E-mail to Shigenobu AOKI

  • 最尤法

    最尤法     Last modified: May 16, 2002 一致性,有効性,十分性を満たす最適推定量は,最尤法 により求めることができる。 母数が $\theta$ である母集団 $f ( \mathbf{x}\ |\ \theta )$ から,$n$ 個の標 $X_{1}, X_{2}, \dots , X_{n}$ が抽出されたとする。 このとき,確率密度は(1)式で表せる。 \[ f(X_1 \ |\ \theta)\ f(X_2 \ |\ \theta)\ \cdots\ f(X_n \ |\ \theta) \tag{1} \] 今までは,母数 $\theta$ を持つ母集団から抽出された一つの確率変数 $\mathbf{x}$ が $X$ という実現値をとるとして,$f ( \mathbf{x}\ |\ \theta )$ を $\mathbf{x}$ の関数と見

  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ

  • ポアソン分布

    ポアソン分布     Last modified: Aug 30, 2004 ポアソン分布の確率関数は次式で表される。 \[ f(x) = \frac{e^{-\lambda}\ \lambda^{x}} {x!},\ \lambda \gt 0,\ x = 0, 1, \dots \tag{1} \] ポアソン分布の概形は図 1 のようになるが,$\lambda$ が大きくなると正規分布に近づく(アニメーション,または,ムービー)。 二項分布において,生起確率 $p$ が極めて小さい場合がある。このとき,$n$ が十分に大きくても $n\ p$ は有限なものとなる。そこで,$n\ p = \lambda$ とおき,$n \rightarrow \infty$,$p \rightarrow 0$ としたとき,二項分布の( 1 )式の確率関数 $f ( x )$ を,$\lambda$ と

  • 1