タグ

programmingとrに関するhorihorioのブックマーク (160)

  • ■単変量/多変量GARCHモデル - eizoo3010の日記

    2014-11-12 ■単変量/多変量GARCHモデル R Finance GARCHモデルの計算を行うRのパッケージはいくつかあるけど、その中でもRcpp実装のrugarchとrmgarchを自分はよく使っている。これまでコードをきちんと管理してなくて使う度に再実装していたので、使いたい時にいつでも使えるようにメモっておく。 概要 単変量GARCHがrugarchで多変量がrmgarchという構成になっている。これらのパッケージはAlexios Ghalanosという人物によって作成されており、使い方やモデル構成などにある程度の一貫性がある。また、この人はR/Financeとかでも発表しているので動向をチェックしておくと良いかもしれない。加えて、この人は非線形最適化パッケージRsolnpの作者でもあり、精力的にパッケージ開発を行っている。 インストール options(repos="ht

  • R dplyr, tidyr でのグルーピング/集約/変換処理まとめ - StatsFragments

    これの続き。よく使う集約/変換処理もまとめておく。 準備 library(dplyr) library(tidyr) (df <- dplyr::tbl_df(iris)) # Source: local data frame [150 x 5] # # Sepal.Length Sepal.Width Petal.Length Petal.Width Species # 1 5.1 3.5 1.4 0.2 setosa # 2 4.9 3.0 1.4 0.2 setosa # 3 4.7 3.2 1.3 0.2 setosa # .. ... ... ... ... ... グルーピング/集約 ある列の値ごとに集計 Species 列ごとに Sepal.Length 列の合計を算出する場合、 df %>% dplyr::group_by(Species) %>% dplyr::summa

    R dplyr, tidyr でのグルーピング/集約/変換処理まとめ - StatsFragments
  • Rでk-means法とその拡張2 x-means編 - サボタージュ禁止のおさぼり日記

    あっ, どーも僕です。 注意!!エントリーの記述はRソースを含めて全面的に書き直しています!!(なぜかこのエントリーはアクセス数が多いので(汗))@2014/9/11 Python版はこちらから. github.com クラスター数が自動で決まるkmeans法 前回はk-means法の実装を示しました。 kmeans法は近い者同士を集めるという直感的に理解しやすいシンプルなクラスタリングですが、そのシンプルさゆえにいくつか欠点(?)があります。 その一つはクラスター数の設定です。 kmeans法ではクラスター数をパラメータとして与えます。...しかし、どうやってクラスター数を設定するればよいのでしょう。...わかりません。職人芸でしょうか。 素人にはクラスター数は決められないでしょうか? 考えるめんどくさいのでアルゴリズムに決めてもらいたいです。 そんなクラスター数をアルゴリズムに決めて

    Rでk-means法とその拡張2 x-means編 - サボタージュ禁止のおさぼり日記
  • NSE(Non-Standard Evaluation)について - 盆栽日記

    NSEについて前回の記事で叫んだところ、kohskeさんが解説記事を書いてくれた。素敵! http://qiita.com/kohske/items/7dbef6ae3ff34c093ce4 NSEの説明についてはこの記事で十分なのだが、なぜ今さらNSEなんてものをHadleyが持ち出してきたのかについて彼の資料を参考に推測していきたい。 Rにおける従来のNSE 上記kohskeさんの記事にあるようにRではNSEが多用されてきた。 「Standard nonstandard evaluation rules」というRの開発ドキュメントもある。 http://developer.r-project.org/nonstandard-eval.pdf これだけ普及しているのだから今さらとりたてて言う話でもないように思える。 なぜ今さらNSEについて言及するのか ではなぜ今さらdplyrの作者であ

    NSE(Non-Standard Evaluation)について - 盆栽日記
  • dplyrのなんたら_eachを効率的に使う - 盆栽日記

    正直誰でも知ってる関数だし他にも解説している記事はあるので今さらだが、dplyrパッケージのなんたら_each関数の使い方をまとめる。 なんたら_eachを知ることでコピペを連発していたうちの同僚は感動のあまり涙の海に沈んだ。 たとえば以下のように一つの列に対して複数の操作を加えたいことがある。 iris %>% group_by(Species) %>% summarise(MIN=min(Sepal.Length), MEAN=mean(Sepal.Length), MEDIAN=median(Sepal.Length), MAX=max(Sepal.Length) ) 1つの列ならまだいいが、これが複数の列になると心が闇に染まる。 iris %>% group_by(Species) %>% summarise(MIN_SL=min(Sepal.Length), MEAN_SL=me

    dplyrのなんたら_eachを効率的に使う - 盆栽日記
  • Introduction | pipeR Tutorial

    pipeR Tutorial by Kun Ren pipeR is an R package that helps you better organize your code in pipeline built with %>>% or Pipe(), which is much easier to read, write, and maintain. The package defines a set of syntax tailored for unified, intuitive piping experience. This allows you to write code like a streamline that is consistent with your logic and intuition. This tutorial serves as a complete g

  • Rのクラス周りが混沌としているので誰かまとめてください - 盆栽日記

    首題の通りです。他言語と比較した方がいいと思うのですがいかんせん私はその経験が少ない。 各クラスの内容ではなく周辺知識だけ以下にまとめておきますね。 個人的にR5はslideshareパッケージを作るときに使ってみて使いやすかった憶えがあります。 S3 最古参のクラス。Googleのコード規約はこれを勧めていたような。 S4 Bioconductorはこれで書くことになってた気がするけど今はR5でもいいのかな。 Reference class(R5) Rの組み込みのクラスの中ではこれが最新。これは使用経験があるが、なんでもありのS3、制約の多いS4に比べると使いやすかった。 R6 RStudioのエンジニア、Winston Changが作った新しいクラス。Rの組み込みではなくR6パッケージを読み込んで使う。他言語のオブジェクト指向に近くて書きやすいとか。 参考にしようとしている資料 R6の

    Rのクラス周りが混沌としているので誰かまとめてください - 盆栽日記
  • Shiny - Shiny for R cheatsheet

    The Shiny cheatsheet provides a tour of the shiny package and explains how to build and customize an interactive app.

    Shiny - Shiny for R cheatsheet
  • 世界一簡単なrstanコード

    もう自分のモデルがどこまで混沌としているかわからなくて,rstanをつかいながらごく簡単なものを確かめるところまで戻ってきた。 ある標準正規分布から乱数発生に寄って得られたデータセットyの平均と分散を推定するプログラム。一瞬で終わる。確実に収束する。まあ初めてMCMCする人はここから確認するとよいかもしれないので,一応書きさらしておく。このままRにコピペで動きます。 2015.03.05 追記)修正を行いました。修正点についてはこちらを参照。 library(rstan) n <- 100 mu <- 50 sig <- 10 y <- rnorm(n,mu,sig) stancode <- ' data{ int<lower=0> T; real N[T]; // data } parameters { real mu; real<lower=0> s2; } model{ N~norm

    世界一簡単なrstanコード
  • Welcome · Advanced R.

    This is the companion website for “Advanced R”, a book in Chapman & Hall’s R Series. The book is designed primarily for R users who want to improve their programming skills and understanding of the language. It should also be useful for programmers coming to R from other languages, as it explains some of R’s quirks and shows how some parts that seem horrible do have a positive side. Introduction F

  • Rでリーカーターモデル : The アクチュアリー

    June 15, 201422:31 カテゴリ死亡率 Rでリーカーターモデル Rのパッケージ「demography」の紹介です。 今回使用したのは、以下のデータ。以前ブログでも紹介した「日版死亡データベース」です。 <引用元> 国立社会保障・人口問題研究所「日版死亡データベース」, http://www.ipss.go.jp/p-toukei/JMD/index.html (2014年6月15日ダウンロード) まず、「demography」のパッケージを読み込んで、 library(demography) 「read.demogdata」で、死亡率とエクスポージャのデータを読み込み、 JMD<- read.demogdata("JMD_mortality.txt", "JMD_population.txt", type="mortality", label="JPN") 「lca」で、

    Rでリーカーターモデル : The アクチュアリー
  • 日次データから月末のみを抽出する - My Life as a Mock Quant

    今すぐ貴方がフォローすべきたった1つのトゥイッターアカウントである@Nekopuni_氏が [R]日次データから月末のみを抽出する - http://t.co/UGE4zFnCK8— レベル相関皆殺しマン (@Nekopuni_) 2014, 6月 14 なことを呟かれていて、詳細は以下のBLOGポストにある。 日次データから月末のみを抽出する – Momentum 彼が上記のポストで書いてることをもうちょい楽にやるには…to.monthlyでOKながもする。似たような話は昔まとめていたような記憶もある。あるが、よく覚えていないので、ログを漁る必要がある。 library(xts) data(sample_matrix) x <- as.xts(sample_matrix)[,1] to.monthly(x) こんな感じで月末だけになる。 > to.monthly(x) x.Open x.

    日次データから月末のみを抽出する - My Life as a Mock Quant
  • SEMとベイジアンネットワークとBUGS/Stanの関係

    ===== 2014.6.6に一部修正しました ===== 自分用のメモです。間違っていたらtwitterでDMなりメンションなりください。 SEMStructural Equation Modelingの略で「構造方程式モデリング」と和訳されています。共分散構造分析は構造方程式モデリング(SEM)の古い名称です。共分散以外の行列も扱えるので、共分散構造分析という名称は適当ではないということで、最近では構造方程式モデリングという言い換えのほうが主流とのことです。心理統計やアンケート解析でよく使われる因子分析と多重回帰分析(パス解析)の拡張となっており、因果関係によりフォーカスしたモデル体系と言えるでしょう。 BUGS/Stanで何でもありのモデリングに比べた時の制約は次の通りです。 使える分布はnormal()とmulti_normal()のみ。応答変数は説明変数の線形結合の回帰式で表され

  • Welcome thertrader.com - BlueHost.com

    Bluehost - Top rated web hosting provider - Free 1 click installs For blogs, shopping carts, and more. Get a free domain name, real NON-outsourced 24/7 support, and superior speed. web hosting provider php hosting cheap web hosting, Web hosting, domain names, front page hosting, email hosting. We offer affordable hosting, web hosting provider business web hosting, ecommerce hosting, unix hosting.

    Welcome thertrader.com - BlueHost.com
  • R3.1.0インストールの注意 -

    2桁目が上るときはパッケージが引き継がれないので注意が必要です。下記の要領で同じパッケージがインストール可能です。 ## インストール前にRで下記を行う。 dput(rownames(installed.packages())) ## c("base", ....... , "zoo")みたいな長いのが出力されるので何処か別の所にコピペ保存。 ## 新しいバージョンをインストールする。開く。 ## さっきのコピペを使う myPkgs <- c("base", ....... , "zoo") ## いま作ったベクトルに含まれるパッケージを依存関係ごとインストール install.packages(pkgs = myPkgs, dependencies = TRUE)) 訂正: dependencies = TRUEをすると同じパッケージを何回もインストールするかもしれませんので、下記のよう

  • Some R Resources for GLMs

    Revolutions Milestones in AI, Machine Learning, Data Science, and visualization with R and Python since 2008 by Joseph Rickert Generalized Linear Models have become part of the fabric of modern statistics, and logistic regression, at least, is a “go to” tool for data scientists building classification applications. The ready availability of good GLM software and the interpretability of the results

    Some R Resources for GLMs
  • Google グループ

    Google グループでは、オンライン フォーラムやメール ベースのグループを作成したり、こうしたフォーラムやグループに参加したりすることで、大勢のユーザーと情報の共有やディスカッションを行うことができます。

  • caret package webinar

  • Rの知識を更新したい - 300億円欲しい

    Rの知識を改めたいです. 日々パッケージが更新されているのでついていけませんが, 多少は抗いたいです. ※ 以下、個人の感想です ※ 間違いがあったら直します イコールで代入しよう 矢印で代入するのは面倒ですよね. 実はイコールが使えます. > x <- 100 > y = 100 > c(x,y) [1] 100 100 関数の引数指定と混同されるとエラーになります. > system.time(x = 10) 以下にエラー system.time(x = 10) : 使われていない引数 (x = 10) > system.time(x <-10) ユーザ システム 経過 0 0 0 こういう時は我慢して矢印を使いましょう. Googleのコーディング規約によると、矢印代入は怒られるみたいです。 理由が分かったら、更新します。 data.tableを使おう データ保持の際には, data

    Rの知識を更新したい - 300億円欲しい
  • Free books on statistical learning | R-bloggers

    [This article was first published on Hyndsight » R, and kindly contributed to R-bloggers]. (You can report issue about the content on this page here) Want to share your content on R-bloggers? click here if you have a blog, or here if you don't. Hastie, Tibshirani and Friedman’s Elements of Statistical Learning first appeared in 2001 and is already a classic. It is my go-to book when I need a quick

    Free books on statistical learning | R-bloggers