使用データ 今回もいつも通りGoogle Trendsのデータを使います。『引越し』というワードの検索数データをGoogle Trendsのサイトからcsv形式でダウンロードしておきます。単位は週次(7日間ごとの値)です。 (注:下図のグラフは5年間くらいのデータのうち、直近約2年半のものです。最大値が100になっていないのはそのためです。) 今回”引越し”というワードを使用した理由は、顕著な季節性が存在すると考えたためです。グラフを見ると、毎年1月〜4月に検索数が増える傾向にあります。理由は明らかで、この時期は4月の新生活前に引越しを検討する人がたくさんいるためだと思われます。 モデル このデータに状態空間モデルを適用し、トレンド成分と周期性成分に分解してみようと思います。 $$ y_t = \mu_t + \gamma_t + \varepsilon_t,\ \varepsilon_t
◯タイトル通り,PyMC3でWBICを求めてみました。 なお,WAICはpymc3.stats.waicで求められるので*1,やっていません。 ◯元ネタは,以下の記事です。 RのstanでやられていたのをPythonのPyMC3に移植してみました。 statmodeling.hatenablog.com ◯私が頑張った*2ポイントとしては,以下の3点です。(詳しくはコードを見て下さい) 逆温度をもつ分布が標準実装されてないので,Custom Distributionで作った observed=Yと一括で指定することはせずに,データ数だけ分布を用意してobserved=Y[i]としたか WBICにデータごとの対数尤度が必要になるので,pm.Deterministicでobs[i].logpt / betaして無理矢理取ってくる ◯実際に用いたコードは文末に添付しますので参考にしてください
Hierarchical Bayesian Neural Networks with Informative Priors Imagine you have a machine learning (ML) problem but only small data (gasp, yes, this does exist). This often happens when your data set is nested – you might have many data points, but only few per category. For example, in ad-tech you may want predict how likely a user will buy a certain product. There could be thousands of products b
TL;DR 以下記事をもとに、PyMC4のバックエンドにtensorflowが採用された経緯をまとめました。 see: Theano, TensorFlow and the Future of PyMC – PyMC Developers – Medium ポイント tensorflowには既に多くのユーザがいること(デファクトスタンダードであること) 確率プログラミングに必要な確率分布や変換処理が実装されているtensorflow probability(edward2)が使えること tensorflow probabilityは低レベルでフレキシブルなAPI、PyMC4は高レベルでユーザフレンドリーなAPIという棲み分けが上手くできること PyMC4のバックエンドにtensorflowが採用された理由 PyMC3のバックエンドのTheanoが開発停止 まずは2018/05/18の以下記
Welcome to the PyMC wiki pages. Everything that is of interest to users or contributors should be published in the documentation website (source code), if it is related to PyMC it must have a place there, and if it doesn't have a place yet it means we have to create it. Therefore wiki pages should be restricted to content that for some other reason can't be added to the documentation. Examples of
TL;DR pythonの環境構築は Miniconda — Conda を使った方がいい 日付の順番でコミットログを追っていくと、順番が逆だったりするので単にコミットタイトルをブログの件名にすることにした。(順番が逆転するのはおそらくrebaseとかcherry-pickが原因) そもそもgit的に日付の順番は保証されているわけではないので注意。 また、後で自分が件名でコミットを検索しやすいようにハッシュ値も入れておくことにした。 コミット 2018/06/02のコミットです。 Create skeleton, set up CI (#3) · pymc-devs/pymc4@fe7a3f5 · GitHub 以下のPRの会話にあるように新規プロジェクトを作成する際のボイラープレートコードを追加しただけのようです。 This adds a bunch of boilerplate for
最近はベイズが流行っているので自分もベイズを齧ろうと、冬休みにA/Bテストをpythonで行ってみました。 使用したのはpymc3です。事前知識は、信用区間は信頼区間と違って解釈がし易いよ!、A/Bテスト(RCT)ってこんなことをやってるよ!くらいを想定しています。 ちなみに個人的にはA/Bテストっていう言葉よりRCTという言葉のほうが好みです。 参考資料 A/Bテスト テストデータの作成 MCMCによるパラメータ推定とその結果 結果の考察 点推定を求められたら 検定力(サンプルサイズ)について よくわからない所 終わりに 参考資料 参考資料は以下の通りです。 Pythonで体験するベイズ推論 PyMCによるMCMC入門 作者: キャメロンデビッドソン=ピロン,玉木徹出版社/メーカー: 森北出版発売日: 2017/04/06メディア: 単行本(ソフトカバー)この商品を含むブログ (1件)
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く