タグ

ブックマーク / dichika.hateblo.jp (5)

  • tapplyの再実装で高速化 - 盆栽日記

    applyとかtapplyとか遅い。Rcppで楽したい。けど苦労はしたくない。 そんなときKmiscパッケージのrcpp_tapply_generator関数が役に立ちます。 使い方は簡単。tapply関数のFUNをreturnとともに放り込むだけ。 install.packages("Kmisc") library(Kmisc) cppTapply <- rcpp_tapply_generator("return mean(x);") 速さを測ってみます。 install.packages("microbenchmark") library(microbenchmark) microbenchmark( tapply(iris$Sepal.Length, iris$Species, mean), cppTapply(iris$Sepal.Length, iris$Species), ir

    tapplyの再実装で高速化 - 盆栽日記
  • packratで人類の拡大再生産に貢献する - 盆栽日記

    こんにちは。R Advent Calendar 20日目です。 一人でも私は生きられるけど、でも誰かとならば人生ははるかに違いますね。 中島みゆきがそう歌っているので間違いないと思います。 そんな人との関わりが避けられない世の中で、reproducibleな環境を作ることは分析の手法を何にするか ということと同じくらい大切な問題かもしれません。 今回はそんなreproducibleな環境を作るためのpackratパッケージのご紹介です。 packratパッケージでプロジェクト単位でのパッケージ管理を実現 packratパッケージは、Pythonでいうところのvirtualenvみたいなもんです。 まだ出来立てなのであそこまで高機能なわけではなくパッケージ管理だけですが。 packratでプロジェクト単位でパッケージ管理が可能になります。 つまり「お前のコード動かないんですけど」「???」「

    packratで人類の拡大再生産に貢献する - 盆栽日記
    aaaazzzz036
    aaaazzzz036 2014/01/03
    R パッケージ管理
  • Rで地図を塗りわける - 盆栽日記

    Rで地図の色を塗り分けたいこととかありますよね。計画停電とか計画停電とか計画停電とか。 で、そんなときはmaptoolsを使うのですが、ある時に仕様が変わったらしくネットの資料はそれに対応してなかったりするわけです。 ということで自分用にメモ。 まず下記の場所で平成17年国勢調査(小地域)を選択し、欲しい地域のデータをダウンロードする。 (地図を描くためだけであれば境界データがあればよいので、適当に男女別人口総数とか選んで次へ進み境界データのみダウンロードしておく。) http://www.e-stat.go.jp/SG2/toukeichiri/SelectDownload.do 今回は大田区のデータをダウンロードしてみた(勉強会がよくここであるので)。 zipでダウンロードされるので、解凍して.shx、.shp、.prj、.dbfの4つのファイルがあることを確認する。 あとは以下のスク

    Rで地図を塗りわける - 盆栽日記
  • PythonからRを使いたい -だがRPy2おめーはダメだ- - 盆栽日記

    経緯 とある事情でランダムフォレストを使いたいのだがrandomForestパッケージは因子のレベルが32までというFORTRAN実装を引きずっており今回のデータには合わない。 ならばとpartyパッケージのcforestを使ってみたが今度はメモリが足りなくなった。 諦めて因子のレベルを32以内にすればいいのだろうが、せっかくなのでPythonを使ってみたい。 で、Scikit-learnにランダムフォレストが実装されてるとのことなので入れてみた。 http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn Scikit-learnについてはこれでおしまい。 ところで、↑のサイトを眺めているとRPy2がある。 RPy2に関しては当方Win7の64bit環境だが以前は32bitのものしかなくインストールすらうまくいかなかったことを思い出した

    PythonからRを使いたい -だがRPy2おめーはダメだ- - 盆栽日記
  • 緑本メモ - 盆栽日記

    MCMCで混合効果モデルのパラメータ推定をやりたい。 R(+外部アプリ)でやろうとするととりあえず以下の方法があるようで。 (Task-viewを読む限り他にもいろいろあるけど、日語情報の量等考慮して以下を選んだ。) MCMC+パラメータ推定を一括でRでやってしまう lmmパッケージを使う MCMCglmmパッケージを使う lme4パッケージを使う MCMCを外部アプリに任せる WinBUGS(JAGS/OpenBUGS)をR2WinBUGS(rjags or R2jags/BRugs)から使う 一括でRでやる方が簡単そうだけど、今読んでいる(http://hosho.ees.hokudai.ac.jp/~kubo/ce/IwanamiBook.html 以降、緑と呼ぶ)が最後の方法を用いているので勉強がてらこれでいく。 ただしWinBUGSはWindows7にインストールできないの

    緑本メモ - 盆栽日記
  • 1