タグ

rと統計に関するxiangzeのブックマーク (33)

  • 生態学データ解析 - FAQ モデル選択

    統計学的なモデル選択 (とくに AIC を使ったモデル選択) についてよくある質問と 久保 によるてきとーなる回答を並べてみました 参照: FAQ 系ペイジ一覧, FAQ stepAIC() モデル選択 [項目] モデル選択とは何ですか モデル選択したあとに検定すればいいのですか? モデル選択規準 AIC が一番小さいモデルは一番あてはまりの良いモデルですか? AIC によって選択された統計モデルってどういう意味で「良い」のですか? AIC で選ばれる統計モデルは標数に影響されますか? AIC が少しでも小さい統計モデルが「良い」モデルなのですか? 統計ソフトウェアが出力する AIC の値だけ確認すればいいのですか? 比較すべき統計モデルの個数が 100 個ぐらいあるんですけど,このときも AIC 最小のモデルを選べばよいのですか? 「パラメーターの重要性」をみるために ``Akaike

  • JIN'S PAGE

    R、R言語、R環境・・・・・・ Rのダウンロードとインストール リンク集 題名 Chap_01 データ解析・マイニングとR言語 Chap_02 Rでのデータの入出力 Chap_03 Rでのデータの編集と演算 Chap_04 Rと基統計量 Chap_05 Rでの関数オブジェクト Chap_06 Rでのデータの視覚化(1) Chap_07 Rでのデータの視覚化(2) Chap_08 Rでのデータの視覚化(3) Chap_09 GGobiとデータの視覚化(Rgobi) Chap_10 Rと確率分布 Chap_11 Rと推定 Chap_12 Rと検定 Chap_13 Rと分散分析 Chap_14 Rと回帰分析 Chap_15 Rと重回帰分析 Chap_16 Rと一般化線形モデル Chap_17 Rと非線形モデル Chap_18 Rと判別分析 Chap_19 Rと樹木モデル Chap_20 WEK

    xiangze
    xiangze 2013/02/10
    最初の方は書籍「Rによるデータサイエンス」の内容とかぶっている。カデゴリカルデータ、GIS,テキスト解析、Excelとの関係などは書籍にはない。
  • Small Data Scientist Memorandum R+BUGSで時系列データを階層ベイズモデル(AR model)で解析する (1) BUGS編

    ほんとの薬を投与した場合にTreat = 1になっています。 RからWinBUGSを動かす方法のセットアップは久保先生のに載っているので割愛します(要望があればインストールから詳しく書きます)。データを見て時系列がわりとなめらかであること、今回は薬によって減少したか(増加したか)の傾きを知りたいことなどからAR modelを採用しました。BUGSコードは以下になりました。 2~9行目がモデルの数式をBUGSコードに直したものに相当し、11~42行目が事前分布の設定になります。ざっと説明します。 ・(3行目, 6行目) mu.yは真の値でそこからノイズ(機器の測定誤差みたいなものを想定)を加えて観測値Yが得られます。 ・(4行目) mu.yの初期値は人によらないbaseline.0と個体差baseline[i]に分けて推定します。このようにするとbaseline.0は無情報事前分布、個体差

  • RPubs - 階層ベイズモデル サンプル1

    Hide Comments (–) Share Hide Toolbars

  • Kernel Bayesian Computation の R による実装例 - 捨てられたブログ

    少し前の事ですが ,京都大学で行われた日遺伝学会第 83 回大会に参加しました。その中の "Kernel Bayesian Computation" という講演が気になりました。 集団遺伝学の世界ではモデルが複雑な場合に尤度を回避できる approximate Bayesian computation (ABC) という手法がよく用いられます。 ABC についてはブログでも『近似ベイズ計算によるベイズ推定』や『Tokyo.R#17』[A] でまとめています。しかし ABC は計算コストが非常に高いのが難点です。 Kernel Bayesian computation (KBC) は ABC と同様に尤度計算を行わずにベイズ推定をする手法なのですが, ABC のような無駄な計算がないのが特徴です。そこで, KBC を R で実装してみました。 [warning] 警告 私自身,まだきちん

  • 生態学データ解析 - GLM 参照

    一般化線形モデル (generalized linear model; GLM) を簡単に紹介するペイジです 一般化線形混合モデル (GLMM) については GLMM 参照 一般化 (generalized) ではない一般線形モデル (general linear model) も GLM とよばれることがあります 端的に言うと,一般線形モデル (正規分布モデル) は一般化線形モデル (他の分布も OK) の一部です [もくじ] GLM の特徴 ネット上の GLM の解説 GLM を推定計算する R の関数 雑 書籍 GLM の特徴 データのばらつきが二項分布やポアソン分布のときにも使える (その他,正規分布やガンマ分布の場合も) 「世の中は何でもかんでも正規分布でいいんだ」といったまちがった考えかた (まちがった統計モデリング) から脱出するときに有用でしょう link 関数を指定するこ

  • CRAN Task View: gRaphical Models in R

    Wikipedia defines a graphical model as follows: A graphical model is a probabilistic model for which a graph denotes the conditional independence structure between random variables. They are commonly used in probability theory, statistics - particularly Bayesian statistics and machine learning. A supplementary view is that graphical models are based on exploiting conditional independencies for con

  • My Life as a Mock Quant

    掲題の件、そういう時あると思います。 結論 まあ、ちょっと考えれば自明なんだが、以下です。 ドルコスト平均法は平均的なリターンを押し下げる(儲かる投資なら!)効果があるので嬉しくはない ドルコスト平均法は最終的な儲けのバラツキ(標準偏差)を押し下げる効果があるので、これは不確実性を削減出来ているという意味で嬉しい 状況と結果 投資期間: 250日間 平均リターン(年率): 7% ボラティリティ(年率): 20% 投資戦略① ①全期間(250日間)において毎日一定金額(1円)を投資した場合の最終的な儲けとそのバラツキ > performance(s1) [1] 258.46619 30.96698 投資戦略② ②初日に全額(250円)を投資した場合の最終的な儲けとそのバラツキ > performance(s2) [1] 266.92645 53.44526 それぞれのシミュレーションを複数回

    My Life as a Mock Quant
  • Home - ianalysis Jimdoページ

    2011年4月4日 Rパッケージ【KsPlot】がCRANで公開開始 http://cran.r-project.org/web/packages/KsPlot/ 2011年4月2日 Rパッケージ【KsPlot】を作成、Downloadsに追加 2011年3月28日 iAnalysisのロゴを追加 2011年3月26日

  • 実践! Rで学ぶ統計解析の基礎 - @IT

    Rは統計解析のブッシュナイフだ 実践! Rで学ぶ統計解析の基礎(1) オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しよう!

  • R+PythonでカーネルPCA(おまけ付き) - dataminer.me

    昨日の勉強会で「Rは便利だけど、図がかっこよくない」という話になったので Rpyで出力した結果をmatplotlibで出力する場所まで書いてみた。 #!/usr/bin/env python # -*- coding: utf-8 -*- #rpy2が使える環境であることを確認 import numpy as NP import random try: import rpy2.robjects as robjects except: print "Rpy2をインストールしてください。" print "UBUNTUの場合、apt-get install python-rpy2 でインストールできます。" print "easy_install が入っている場合は easy_install rpy2 でインストールできます。" print "その他の場合は http://sourceforge

    R+PythonでカーネルPCA(おまけ付き) - dataminer.me
  • 勉強会発表内容一覧 - Japan.R WIki

    各コミュニティで実施された勉強会の内容の一覧です。 気がついた方はどんどん追記していただけると助かります 量が増えてきたらページを分けも検討します Nagoya.R Tsukuba.R Tokyo.R Nagoya.R Nagoya.R #4 (2010/10/30): http://corpus-study.info/nagoyar/wiki.cgi?page=NagoyaR%234 タイトル 発表者 概要 資料

  • R -- 主成分分析

    主成分分析     Last modified: Aug 02, 2009 目的 主成分分析を行う。 R には,princomp および prcomp という,二種類の関数が用意されている。 しかし,これらが返す「loadings」は固有ベクトルそのものであって,いわゆる負荷量ではない。 そこで,princomp2,prcomp2 という関数を書いたので,そちらも参照してみるとよい。 使用法 pca(dat) print.pca(obj, npca=NULL, digits=3) summary.pca(obj, digits=5) plot.pca(obj, which=c("loadings", "scores"), pc.no=c(1,2), ax=TRUE, label.cex=0.6, ...) 引数 dat データフレームまたはデータ行列(行がケース,列が変数) obj pca