タグ

ブックマーク / heartruptcy.blog.fc2.com (4)

  • RStanで『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた

    こんばんは、ゆるふわの対極であるところのガチムチ角刈り系のberoberoです。 この記事はR Advent Calendar 2013の26日目の記事になります。 12/22(日)にBUGS/Stan勉強会#2がドリコム株式会社にて催されました。そこで2つ発表をしました。そのうちの1つ「『予測にいかす統計モデリングの基』の売上データの分析をトレースしてみた」に関する詳細&補足&苦労話をここで書きたいと思います。RStanというパッケージでRからStanというMCMCサンプリングソフトを使っています。 最初に発表内容のスライドは以下になります。ざっと見るにはこれで十分です。 『予測にいかす統計モデリングの基』の売上データの分析をトレースしてみた from berobero11 以降ではスライドごとに簡単に補足していきます。 まずは元となった書籍の紹介です。時系列解析の第一人者による分か

    RStanで『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
  • アッシェンフェルターのワイン価格予測式をトレースしてみた

    1990年頃にアッシェンフェルターさん(Orley Ashenfelter)がビンテージワインの価格予測式(回帰式)を構築しました。精度はかなりよかったものの、当然ワイン評論家からはフルボッコにされました。という話を以前tokyo.RのLTで聞きました。 LTで時間が足りないせいもあってか(?)、式の各項の単位がよくわからなかったり、質は線型で増えるが価格はexpで増えるという説明があったりでちょっと気になって自分でその後調べてみました。ググってみるとこんな記事やこんな記事がヒットします。背景の物語には詳しくなりましたが、肝心の式についてはますます謎は深まるばかり。 その後どうもしっくりこなかったので自分で原論文をもとにトレースしました。ソースはここにあり、データもここにありました。 Rで読み込んでちゃっちゃと線型回帰すると となりまして、回帰の係数やRMSEは有効数字4~5桁まで原論文の

  • ベイズモデルで勝敗結果から戦闘力を推定してみました

    モデルを記述する部分であるBUGSコードは以下になります。 真の実力のようなものを「skill」、試合ごとに実力を発揮した力を「performance」としています。「performance」が高いから勝ちとなったと考えるわけです。そして「performance」は平均が「skill」の正規分布に従うと考えます。当は実力を発揮する“ムラ”は個人ごとにだいぶ違うのは周知の事実です。例えば、ある人は安定していて格下にはキッチリ勝つけど格上には勝てないとか、ある人は格下にも負けるけど格上にも勝つときがあるとかありますよね。しかし、今回は勝敗データが少ないのでそこを階層化して求めるのはきついです。今回は元ネタと同様に、その“ムラ”の分散は「1」と固定しました。 BUGSコード的に少し難しいところは『performanceが高いから勝ち』という制限をうまく入れる必要がありまして、BUGS Book

    ベイズモデルで勝敗結果から戦闘力を推定してみました
  • RSRuby: RをRubyから使う

    現在自分向けのtwitter filteringサイトを作っています。 その過程でいくつか備忘録がてらブログに残しておきたいことがありましたので書きます。 1つめはRubyからRを使うRSRubyの使い方です。3年ぐらい前から使っているのですがなかなか高速でいいです。 まずはインストール方法から。環境は以下の通りです。 Windows 7 SP1R version 3.0.1 (2013-05-16) 参考ページはこちら(金子先生のホームページは役立つ情報が満載です)。 rubyとrsrubyは以下のバージョンをインストールしました。 ruby 2.0.0p195 (2013-05-14) [i386-mingw32]rsruby (0.5.1.1) RubyInstallerをinstallします。(official)Development Kit(DevKit) もinstallします

  • 1