Rに関するEulerDijkstraのブックマーク (64)

  • RStanで『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた

    こんばんは、ゆるふわの対極であるところのガチムチ角刈り系のberoberoです。 この記事はR Advent Calendar 2013の26日目の記事になります。 12/22(日)にBUGS/Stan勉強会#2がドリコム株式会社にて催されました。そこで2つ発表をしました。そのうちの1つ「『予測にいかす統計モデリングの基』の売上データの分析をトレースしてみた」に関する詳細&補足&苦労話をここで書きたいと思います。RStanというパッケージでRからStanというMCMCサンプリングソフトを使っています。 最初に発表内容のスライドは以下になります。ざっと見るにはこれで十分です。 『予測にいかす統計モデリングの基』の売上データの分析をトレースしてみた from berobero11 以降ではスライドごとに簡単に補足していきます。 まずは元となった書籍の紹介です。時系列解析の第一人者による分か

    RStanで『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
    EulerDijkstra
    EulerDijkstra 2014/01/07
    “AR項をこうやって普通に入れるだけで月のオーダーになりそうという感覚はどこからくるんですかね?すごいです。結果見て解釈するのでしょうか。分かりません。”
  • Rで3層線形ニューラルネットワークのWBICの計算をしてみた - motivicのチラ裏

    WAICを計算したついでにWBICも計算しちゃおうってことでしてみた。 元ネタは渡辺先生のHPのこちら。 http://watanabe-www.math.dis.titech.ac.jp/users/swatanab/wbic2012.html ここでやろうとしていることは、3層線形ニューラルネットワーク(縮小ランク回帰)で2層目の中間素子が3個である真のモデルから発生させたデータから、中間素子が1~6個である候補モデルからWBICで正しくモデル選択ができるかを見ています。 また、実対数閾値λの推定値も算出しています。 # Constants in Reduced Rank Regression Y=B*A*X+noise MM <- 6 # Input Dimension HMAX <- 6 # Hidden Dimension NN <- 6 # Output Dimension H

    Rで3層線形ニューラルネットワークのWBICの計算をしてみた - motivicのチラ裏
  • Web上でデータの可視化ができるPlotlyをRで試してみる - Dimension Planet Adventure 最終章 最終話『栄光なる未来』

    この記事は『R Advent Calendar 2013』12日目の記事です。 Plotlyとは? plotly | Analyze and visualize data, together Plotlyはオンライン上でデータの可視化できるWebサービスです。 作成したグラフをブラウザ上で確認したり、ズームイン・ズームアウトが可能です。 有名ドコロですと、ワシントン・ポストが採用したことがあるそうですね。 Do low taxes on the rich leave the middle-class with lower wages? あとは、Mashableとか。 How Do NBA Superstars Stack Up on Social Media? You Decide Plotlyには嬉しい事に、様々な言語のAPIが用意されているので、自分の好きな環境で試すことが可能です。

    Web上でデータの可視化ができるPlotlyをRで試してみる - Dimension Planet Adventure 最終章 最終話『栄光なる未来』
  • スプライン曲線で簡単お手軽ベイズ推定 - アドファイブ日記(ミラー版)

    R Advent Calendar 2013の11日担当記事です。 日付を一日勘違いしてしまい一日遅れになってしまいました。すみません。 テーマは、スプライン曲線で自由に設定した確率分布を使ってベイズ推定をやってみよう、というものです。ガウス分布もベータ分布も出てきません。え、共益分布?なにそれ、尤度関数にマッチする事前分布を設定すればパラメータの更新だけで事後分布出てきますよだって?ノンノン、記事はそんな小難しいこと知らなくてもベイズ推定のキモは試せるぜ、という話です。 さて能書きはこれくらいにして題。 R言語でスプライン曲線 飛び飛びの点を用意してsmooth.splineというの関数に与えると、スプライン補間した関数(に相当するオブジェクト)を返してくれます。それに任意のxの点を与えると対応するyの点を返してくれます。 例えば xy<- rbind( c(0,10), c(20,

    スプライン曲線で簡単お手軽ベイズ推定 - アドファイブ日記(ミラー版)
  • Apply family を使ってみる - 驚異のアニヲタ社会復帰の予備

    この記事はR Advent Calendar 2013の12月7日の配当記事です。 そこそこにRを使っていままでやってきたが、Rの特徴としてときたま挙げられるのがapply関数群だと思う。 一番よく使うのは apply だと思うが、初心者が慣れるのに難しい割にはそんなに解説テキストが転がっているわけでもなさそうなので書いてみる。 Rの利点としてのベクトル演算を活かす、というのがapplyっぽいが、それを活かしたからといって高速化するわけではない。が、applyを使いこなせるメリットとしては、何をやっているかがわかりやすい、というのと、スクリプト行数が減る、ということだと思っている。 がしかし、初心者や複数人でコードを書く場合は、愚直に多重 for loop を書いておくほうがかえってわかりやすいかもしれない。 まずは apply関数群のお仲間を探す。 apropos("pply") # *

    Apply family を使ってみる - 驚異のアニヲタ社会復帰の予備
  • R-sig-geo - spatial autocorrelation for categorical data.

    EulerDijkstra
    EulerDijkstra 2013/11/06
     カテゴリカルな空間的相関量“Moran join count”について
  • TerraでRの拡張を書く話 - 盆栽日記

    TerraというLuaベースの言語がある。 http://terralang.org/ で、Rの拡張を書く際にC++とかCとか使う代わりにこのTerraを使うという話をしている人がいる。 http://people.mozilla.com/~sguha/blog/2013/05/21/Terra-and-R-Is-Terrific.html My reasons for investigating TerraLang is to find an extension language for R that has good performance characteristics. The current choice is C++ (using Rcpp) or Java (using rJava). Both languages are performant and in many cas

    TerraでRの拡張を書く話 - 盆栽日記
  • Rで計量時系列分析:VARモデルの基礎(多変量時系列モデル) - 渋谷駅前で働くデータサイエンティストのブログ

    前回の記事では単変量の時系列までを扱いました。今回は多変量(ベクトル)時系列を記述するVARモデルとその周辺のポイントを取り上げます。 ということでしつこいですが、使用テキストはいつもの沖です。 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) 作者: 沖竜義出版社/メーカー: 朝倉書店発売日: 2010/02/01メディア: 単行購入: 4人 クリック: 101回この商品を含むブログ (6件) を見る 以下タイトルにのっとってRで各モデルの挙動を見ながらやっていきます。 必要なRパッケージ {vars}をインストールして展開して下さい。{forecast}や{tseries}などは今回は特に使いません。 多変量における自己相関、定常性など 単変量時系列過程の際にさんざん自己相関やら定常性やらうるさく言っておいて、まさか多変量にした時にガン無視ってわけにもいきませんの

    Rで計量時系列分析:VARモデルの基礎(多変量時系列モデル) - 渋谷駅前で働くデータサイエンティストのブログ
    EulerDijkstra
    EulerDijkstra 2013/07/26
    VARモデルについて
  • R Tutorials--Multiple Regression

  • アッシェンフェルターのワイン価格予測式をトレースしてみた

    1990年頃にアッシェンフェルターさん(Orley Ashenfelter)がビンテージワインの価格予測式(回帰式)を構築しました。精度はかなりよかったものの、当然ワイン評論家からはフルボッコにされました。という話を以前tokyo.RのLTで聞きました。 LTで時間が足りないせいもあってか(?)、式の各項の単位がよくわからなかったり、質は線型で増えるが価格はexpで増えるという説明があったりでちょっと気になって自分でその後調べてみました。ググってみるとこんな記事やこんな記事がヒットします。背景の物語には詳しくなりましたが、肝心の式についてはますます謎は深まるばかり。 その後どうもしっくりこなかったので自分で原論文をもとにトレースしました。ソースはここにあり、データもここにありました。 Rで読み込んでちゃっちゃと線型回帰すると となりまして、回帰の係数やRMSEは有効数字4~5桁まで原論文の

    EulerDijkstra
    EulerDijkstra 2013/07/16
    これは良記事!
  • WindowsでEmacs+ESSでlocaleが設定できない問題の解決方法 - はやしのブログ Rev.3

    追記:この問題は,gnupack4.08aでは起きません。ただし,別の問題が発生しています。 id:Rion778さんがWindowsでのESSの設定について素晴らしい記事を書いてくれました。 http://d.hatena.ne.jp/Rion778/20100920 僕もgnupackを使っているのですが,再インストールを繰り返しているうちに設定がめんどくさくなって放置しています…。 さて,id:Rion778さんがヘルプを出されている点について,以前同じところでつまずいて,解決できていたような気がしたので(しかしその方法は放置している間にすっかり忘れていた)記事にしておきます。 ところでこれまでの方法で設定するとR起動時に「起動準備中です - 警告メッセージ: Setting LC_CTYPE=ja_JP.cp932 failed」などと出たうえ、plotなどでR Graphicsデ

    WindowsでEmacs+ESSでlocaleが設定できない問題の解決方法 - はやしのブログ Rev.3
  • Managing RStudio Workbench / RStudio Server

    EulerDijkstra
    EulerDijkstra 2013/07/03
    Upgrading to a New Version 普通にパッケージマネージャを使えばよいらしいが。
  • R: rJavaのエラー

    エラーメッセージ:Error : .onLoadはloadNamespace()(rJavaに対する)の中で失敗しました、詳細は: call: inDL(x, as.logical(local), as.logical(now), ...) error: 共有ライブラリ 'c:/opt/r/libs/rJava/libs/rJava.dll' を読み込めません LoadLibrary failure: 指定されたモジュールが見つかりません。 エラー: 'rJava' に対するパッケージもしくは名前空間のロードが失敗しました rJava.dllはあるのになぜ?って思ったけど、調べると、jvm.dllが見つからないからエラーが出ているらしい。はじめに出たエラーダイアログをよく見ていませんでした。 環境変数PATH に C:\Program Files\Java\jre6\bin\clientを

    R: rJavaのエラー
    EulerDijkstra
    EulerDijkstra 2013/07/01
    「jvm.dllが見つからないからエラーが出ているらしい。」「環境変数PATH にclientを追加したらうまくいきました。」
  • 多変量時系列解析 1 VARモデル

    ★新サイト完成しました! 3秒後に自動的に移動します 変わらない方は こちらからどうぞ http://logics-of-blue.com/var%E3%83%A2%E3%83%87%E3%83%AB/ Rを用いたVARモデ ル の簡単な解説と計算方法を載せます。 VARモデルとは 前回紹介したのは1変量のARIMAモデルというものでした。 これは「過去の自分のデータから将来の自分を予測する」というものです。たとえば、2000年にサンマがたくさんいたら過去の2001年にもたくさんい ることになるだろうという風に、サンマの予報をするなら、サンマの漁獲量だけに注目してして予測をします。 でも、去年餌になるプランクトンが多かったから今年はサンマが増えた、という風に、「ほかのやつら」の影響を受けているかもしれませ ん。 そんな場合をモデルで表して予測をしてやろうというのが今回扱うVARモデルという

    EulerDijkstra
    EulerDijkstra 2013/06/20
    VARのRでの実行
  • 状態空間モデル

    ★新サイト完成しました! 3秒後に自動的に移動します 変わらない方は こちらからどうぞ http://logics-of-blue.com/%E7%8A%B6%E6%85%8B%E7%A9%BA%E9%96%93%E3%83%A2%E3%83%87%E3%83%AB%E3%81%A8%E3%81%AF/ 状態空間モデルとはいったい何で、どんな時に使うといいのか、使うとどんなご利益があるのかということについて書きます。 状態空間モデル関連のページ 状態空間モデル       状態空間モデルのことはじめ dlmの使い方 Rで正規線形状態空間モデルを当てはめる ロー カルレベルモデル   dlmパッケージを使ってローカルレベルモデルを当てはめる 季節とトレンド        dlmパッケージを使って季節成分とトレンドの入ったモデルを作る 状態空間モデルに関しては、大枠を説明してから 少しずつ補足

    EulerDijkstra
    EulerDijkstra 2013/06/18
    ”データに欠損値があっても使えるという特徴もあります。”
  • 季節とトレンド

    ★新サイト完成しました! 3秒後に自動的に移動します 変わらない方は こちらからどうぞ http://logics-of-blue.com/%E5%AD%A3%E7%AF%80%E3%81%A8%E3%83%88%E3%83%AC%E3%83%B3%E3%83%89/ dlmパッケージを使って、ちょっと複雑な正規線形状態空間モデル(動的線形モデル)を推定します。 今回は、トレンド成分と季節成分の入った状態空間モデルを推定し、予測を行うところまでを行います。 状態空間モデル関連のページ 状態空間モデル       状態空間モデルのことはじめ dlmの使い方 Rで正規線形状態空間モデルを当てはめる ロー カルレベルモデル   dlmパッケージを使ってローカルレベルモデルを当てはめる 季 節とトレンド        dlmパッケージを使って季節成分とトレンドの入ったモデルを作る 作成日  201

    EulerDijkstra
    EulerDijkstra 2013/06/18
    トレンドとレベルの違いについて、季節性はダミー変数と三角関数で表現可能。
  • Forecasting: Principles and Practice (2nd ed)

    Forecasting: Principles and Practice (2nd ed) Rob J Hyndman and George Athanasopoulos Monash University, Australia Preface This is the second edition of Forecasting: Principles & Practice, which uses the forecast package in R. The third edition, which uses the fable package, is also available. Buy a print or downloadable version Welcome to our online textbook on forecasting. This textbook is inten

    Forecasting: Principles and Practice (2nd ed)
    EulerDijkstra
    EulerDijkstra 2013/06/17
    Rで時系列分析、ただで読めるテキストブック
  • Curved arrows in R

    I briefly investigated how to draw curved arrows in R. Here’s a small piece of the figure that I ultimately created: A google search for “curved arrows in R” revealed three options: curvedarrow in the diagram package The internal function igraph.Arrows within the igraph package (mentioned by Gabor Csardi in R help) Using xspline for the shaft and adding the head “by hand” (mentioned by Greg Snow)

    Curved arrows in R
    EulerDijkstra
    EulerDijkstra 2013/05/22
    Rで曲線の→を書く方法
  • 凡例(legend関数)について - 日々のつれづれ

    legend関数は引数が多く、par関数でグラフィックパラメータを調整すれば、細かいアレンジができるので便利。 barplot関数のように、引数で凡例を持つ関数もある。 四隅にlegendを描きたいときは、"topleft","topright","bottomleft","bottomright"を指定する。 > dat <- cbind(A=sample(10,3),B=sample(10,3),C=sample(10,3)) > > jpeg("legend.jpg") > matplot(t(dat),col=1:3,lwd=1:3,pch=20,type="b",xlim=c(0,3)+.5,xaxt="n") > axis(side=1,at=1:3,labels=colnames(dat)) > legend("topleft",legend=colnames(dat),pc

    凡例(legend関数)について - 日々のつれづれ
    EulerDijkstra
    EulerDijkstra 2013/05/21
    legendの使い方についてよいまとめ
  • ・時系列分析(系列相関、ダービンワトソン比、分散不均一) - hnami.net_Pukiwiki

    2014-06-19 SandBox 2014-04-15 microexam 2013-05-11 DCIO 2013-03-15 game2013 2013-03-08 MCmicro 2012-09-18 game2010 2012-02-17 microexamold microexam2010 2011-04-19 appmicro 2011-01-04 semielemental2 2010-04-01 kihonmicro 2009-06-01 radvance 2009-05-17 AICを使った変数選択 step02 step01 stepaiccsv FrontPage 2009-05-13 ロジット分析とプロビット分析 2009-05-10 赤池の情報量基準 2009-05-05 時系列データ分析(2) 時系列分析独特の問題 † 多重共線性以外にも、時系列データを使っ

    EulerDijkstra
    EulerDijkstra 2013/05/21
    系列相関