タグ

ブックマーク / cse.naro.affrc.go.jp (15)

  • R-Source

    回帰分析を行なうために以下の関数が用意されている. lsfit() : 最小二乗法による回帰を行う. lm() : 線形モデルによる回帰を行う glm() : 一般線形モデルによる回帰を行う ここで対象となるモデルは以下のような線形モデルである. 上式をベクトル表記すると y = Xb + e となる.このときの y は応答ベクトル,X は説明変数のベクトル(モデル行列)で,x0 は切片項(要素が全て 1 である列ベクトル)となっている. 回帰分析と重回帰分析 関数 lm() により線形モデルの当てはめを行うことが出来る.この関数により,回帰分析や分散分析,そして共分散分析を行うことが出来る. 詳しい解説は『工学のためのデータサイエンス入門』(間瀬・神保・鎌倉・金藤 共著,数理工学社) を参照のこと.分散分析や非線形回帰についても詳しい解説が載っている. 関数 lm() の書式と引数 書式

  • R-Source

    R にはデータの種類としてベクトルや行列,配列などが用意されている( 1 や 'a' も長さ 1 のベクトル)が,リストはこれら異なる構造のデータを集めて 1 個のオブジェクトにしたものである.異なった型のベクトルを 1 個のリストにまとめてもよいし,リストの要素としてリストを用いても構わない. リストの作成 リストは関数 list() を用いて作成する. ( x <- list(1:5, list("It's my list.", c(T, F, T))) ) [[1]] # 第 1 成分 [1] 1 2 3 4 5 [[2]] # 第 2 成分(リスト)の第 1 成分 [[2]][[1]] [1] "It's my list." [[2]][[2]] # 第 2 成分(リスト)の第 2 成分 [1] TRUE FALSE TRUE

    mahler-5
    mahler-5 2016/11/01
  • 租界〈R〉の門前にて

    ◇宣伝!— 三中信宏『みなか先生といっしょに 統計学の王国を歩いてみよう:情報の海と推論の山を越える翼をアナタに!』 2015年6月5日刊行,羊土社,東京,191 pp., 体価格2,300円, ISBN:978-4-7581-2058-6 → 目次|版元ページ|コンパニオンサイト ◇連載〈統計の落とし穴と蜘蛛の糸〉 羊土社から発行されている雑誌『実験医学』2014年2月号から隔月連載された〈統計の落とし穴と蜘蛛の糸〉記事のオンライン版です. → オンライン連載トップページ 第1回 データ解析の第一歩は計算ではない(2014年2月号, pp. 442-447) 第2回 データの位置とばらつきを可視化しよう(2014年4月号, pp. 935-940) 第3回 データのふるまいをモデル化する(2014年6月号, pp. 1427-1433) 第4回 パラメトリック統計学への登り道〔1〕:ば

  • 二変量正規分布の2D/3Dグラフィクス

    多変量同時確率分布を描画することにより,各変量それぞれの変動(variation)だけでなく,変量間の共変動(covariation)についての直感的な理解を深まるだろう.以下では,〈R〉の多変量正規分布パッケージ〈mvtnorm〉と三次元描画パッケージ〈scatterplot3d〉: mvtnorm: Multivariate Normal and T Distribution (version 0.8-1) scatterplot3d: 3D Scatter Plot (version 0.3-25) を用いて,二変量正規分布の点の散布パターンと密度関数の描画を行なう〈R〉スクリプトを書いた. 1. 基事項 p次元の変量ベクトル x を考える: x の同時確率密度関数 f(x) は下記の通りである: この式の平均ベクトルμと分散共分散行列Σはそれぞれ次式で定義される: 分散共分散行列

    mahler-5
    mahler-5 2015/05/04
  • R-Source

    条件分岐 : if ,else ある条件で場合分けをして処理を行いたい場合は if 文,else 文を使う.以下の「条件式」には TRUE や FALSE の論理値を一つだけ返す式を入れなければならない. x <- 2 if (x > 0) { # if ( 条件式 ) sum(1:x) # 条件式が TRUE のときに実行される部分 } else { x <- -x # 条件式が FALSE のときに実行される部分 sum(1:x) # } if と else を括弧無しで複数行に分けるとエラーとなる(下:3 ~ 4 行目).また,} と else の間で改行するとエラーとなる(下:5 ~ 6 行目).R は, if (条件式) { 式 } の時点で「一連の式が終わった」と思うので,その次に else が出ると「 if が無いのに else が来た!」と思ってエラーを出す.

    mahler-5
    mahler-5 2015/04/19
  • R-Source

    for による繰り返し ある処理を繰り返し行いたい場合,同じ文を何度も書く代わりに for 文を使う. for ( ループ変数 in リスト ) でリストの要素の一番目から順に要素をループ変数にスタックして for 文中の式を実行し,リストの要素が無くなった時点で for ループから抜けるという動作をする.よって繰り返し回数は「リストの要素数」となる. ごく一般的なプログラム言語の繰り返しアルゴリズムと多少異なる. 例えば,ループ範囲に整数値のベクトルを指定すると,x に 1 を 5 回足すことが出来る. x <- 0 for (i in 1:5) { # for (ループ変数 in ベクトルやリスト) x <- x + 1 # ベクトルやリストの要素が空にならない限り式が繰り返される } x [1] 5 ループ範囲を表すベクトルやリストの要素は for 文が始まる際に for 文中でルー

  • 53. グラフィックスパラメータ(弐) - R-Source

    グラフィックスパラメータの一時的変更 この節で紹介するグラフィックスパラメータは,関数 par() で設定することが出来るし,関数 plot() や多くの高水準作図関数の引数としてグラフィックスパラメータを設定することも出来る.例えばプロット点の形を指定するパラメータ pch に関しては,以下の 2 通りの設定方法を用いることが出来る.ただし,関数 par() で設定した場合は,設定した後はもう一度パラメータ値を変更するまではそのままの設定値が使われるが,作図関数の引数としてグラフィックスパラメータを設定した場合は,そのときの作図の場合のみ設定値が使われる (それ以後は直前までの設定値が使われる) . plot(1:10, pch="+") # 一時的にプロット点の形を "+" に変更する par(pch="+") # これ以後,プロット点の形をずっと "+" に変更する plot(1:1

  • R-Source 22.配列

    配列とは行列を多次元に拡張したものである.行列は 2 次元であったが,配列はその次元に応じて 3 次元,4 次元,… のものを作成することが出来る. 配列の作成 配列は以下の手順で作成出来る. 配列の要素をベクトルなどで用意する 関数 array(ベクトル, 配列の次元数) でベクトルから配列に変換する すなわち,配列は関数 array() で作成出来,引数 dim に各次元の要素の個数をベクトルを指定する.また,k 次元の配列は k 個の要素番号でアクセス出来,関数 dim() で配列の次元を調べることが出来る. ( x <- array(1:8, dim=c(1, 4, 2)) ) # 3 次元配列 , , 1 [,1] [,2] [,3] [,4] [1,] 1 2 3 4 , , 2 [,1] [,2] [,3] [,4] [1,] 5 6 7 8 x[1, 4, ] # x[1次

  • R-Source

    統計量 四則演算や初等数学関数は既に扱ったので,ここでは基的な統計量を求める関数を紹介する.まず,10人 の患者から成る 2 グループ x,y にそれぞれ異なる睡眠薬を飲ませ,睡眠時間の増加を示すデータを準備する. x <- c(0.7,-1.6,-0.2,-1.2,-0.1,3.4,3.7,0.8,0.0,2.0) # グループ 1 の睡眠時間の増加を示すデータ y <- c(1.9, 0.8, 1.1, 0.1,-0.1,4.4,5.5,1.6,4.6,3.4) # グループ 2 の睡眠時間の増加を示すデータ

    mahler-5
    mahler-5 2014/11/11
  • 25. データ型とデータ構造 - R-Source

    x <- c(1, 0, 1, 0, 1) mode(x) [1] "numeric" mode(x) <- "complex" # storage.mode(x) <- "complex" でも可 x [1] 1+0i 0+0i 1+0i 0+0i 1+0i mode(x) <- "logical" x [1] TRUE FALSE TRUE FALSE TRUE ベクトルの型の間には以下の大小関係がある. character > complex > numeric > logical > NULL ベクトルの要素は全て同じ型なので,異なった型のデータを集めてベクトルを作ろうとすると上記の変換規則によって『最も大きい』型に揃えられる.また,実数と論理数の間は自動的に変換がなされる.例えば,演算式中に実数値が期待されている時に論理値が表れると以下のように計算される. TRUE  → 1 ,

    mahler-5
    mahler-5 2014/11/08
  • R-Source

    length <- c(80,73,80,82,74,73,68,81,85,85,93,88) # データ group <- c( 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3) # 群

  • 44. データの加工と抽出 - R-Source

    論理ベクトルが TRUE となっている行にのみアクセスする.例えば x[sapply(x, is.numeric)] ならば数値データにのみアクセスする.

  • R-Source

    apply() ファミリー 関数 apply() ファミリーには apply(), mapply(), lapply(), sapply(), tapply() が用意されている.一つの関数を複数のオブジェクトに適用して得られた結果をベクトルや行列,リストとして一括で返す.例えば m × n 行列 X の全ての要素に 1 を足す場合,R では繰り返し文 (for や while) を使わなくても X <- X+1 で手軽かつ高速に実現できるが,この apply() ファミリーに属する関数の機能もこれに似ている.すなわち,C や JAVA ならば複数オブジェクトを個別に与えて繰り返し文で回さなければいけないような場面でも,apply() ファミリーの関数を使えば簡潔な記述で高速に計算できる場面が出てくるということである.

  • 43. データの結合(マージ)と整列(ソート) - R-Source

    x と y を併合(マージ)する.通常は引数に all=T を指定し,データを全て残す.all=T を指定しなければデータの共通部分が結果として返される. id <- c("A","C","E") height <- c(158,177,166) D1 <- data.frame(ID=id, H=height) id <- c("A","B","D","E") weight <- c( 51, 55, 57, 55) D2 <- data.frame(ID=id, W=weight)

  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.

  • 1