サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
アメリカ大統領選
mrunadon.github.io
ggplot2で魅せる・役立つ・引き立つグラフを! 上から順に、コードを実行しながら読んでいただけたら、 およそ必要なスキル(日常で使える大体のグラフ)は出力できるようになっているはずです。
ggplot2で魅せる・役立つ・引き立つグラフを! 上から順に、コードを実行しながら読んでいただけたら、 およそ必要なスキル(日常で使える大体のグラフ)は出力できるようになっているはずです。 本稿は、2017/07/30(Sun) kazutan.R in Tokyoのエントリー(補助資料)です。 本稿のコンセプトは、 「ggplot2の基本的な使い方を知ること」 「基本の組み合わせで、思い通りのグラフ描画につなげること」 ご紹介するコードを組み合わせるだけで、ほとんど思い通りの描画が実現できるはず。
はじめに Rで確率的プログラミング言語STANが利用できる{rstan}パッケージ。 私は普段、ベイズ統計モデリングを行うために使っています。 今回は、rstanを使って多層ニューラルネット(フルコネクションの中間層2層)に挑戦する機会があったので、 備忘録としてまとめておこうと思います。 kerasやmxnetでやるよりも圧倒的に時間がかかります。圧倒的です。 一方で、係数やニューロンの値を事後分布として求めることが出来ます。テストデータのラベルも事後予測分布で求めます。 モチベーションは、この先に考えている「ネットワークのベイズ統計モデリング」にあります。 認知モデリングと組み合わせれば、神経活動のベイズ統計モデリングなんかができちゃうかもしれませんね。 現実的な時間内で求まる程度の小規模データならば、ですが。 参照元は Stanでニューラルネットの実装に関する議論です。コードがそのま
東日本大震災後5年間の地震発生データ分析 Mr.Unadon(Twitter @MrUnadon) 2017/11/26 はじめに 本稿は2017年11月26日に開催された「Hijiyama.R The Final」での発表から、分析部分のみを抜き出した資料となります。 テーマは東日本大震災以降の地震発生に関するモデリングです。 ポアソン分布と二項分布の状態空間モデルを実装します。 メインの解析は二項分布の状態空間モデルとなります。 以下の構成で進めていきます。 データの取得 データの可視化と確認 メカニズムの想像 Stanモデル(ポアソン分布と二項分布の状態空間モデル) 解析結果 library(tidyverse) #データ成形、可視化まわり色々パッケージ群 library(dygraphs) #時系列データ可視化(java) library(formattable) #html ta
Twitterでこの記事をシェアする author: Mr.Unadon (見習い飯炊き兵) 動作環境:Mac OS Sierra 10.12.1; R version3.3.2; rstan 2.10.1 はじめに 本稿は、ベータ分布を用いた時系列解析例に関する前記事の続編です。 「ベータ分布使うより、ロジットで正規分布をたたんだほうが良いのでは」 <なるほど!>といったお話を頂きましたので、 頂いたアドバイスを元に再度整理をしてみます。 以下は、別記事で同じモデルを取り上げた際に頂いたコメントです。ありがとうございます。 モデリングの発展例なども紹介されています。御覧くださいませ。 muに<lower=-5, upper=5>ぐらいで上下限を入れて、sigmaState ~ normal(0,5)としたら収束するようになっていい感じ(添付画像)。6のモデルは動きがロバストで面白いけど、
Twitterでこの記事をシェアする author: Mr.Unadon (見習い飯炊き兵) 動作環境:Mac OS Sierra 10.12.1; R version3.3.2; rstan 2.10.1 はじめに 0から1の間にあるパーセントで表記される割合データに対する回帰系のモデルのお話です。 本稿では、従属変数に対してベータ分布を仮定したベータ回帰のベイズモデルと、 双極関数を平均とするベータ分布でデータを予測させるベータ分布×双極関数モデルをご紹介します。 従属変数は、「都道府県別の人口に占める高齢者福祉施設在所者数の割合」。 説明変数には、「都道府県別の可住地面積に占める人口の割合」、すなわち人口密度的なものを入れました。 都会って、他の人との物理的な距離は近いのに、心の距離は遠いと感じられますよね。 そういう直感から、何かが予測できるんじゃないかと思っての試みです。 パッケ
Twitterでこの記事をシェアする author: Mr.Unadon (見習い飯炊き兵) 動作環境:Mac OS Sierra 10.12.1; R version3.3.2; rstan 2.10.1 はじめに 時系列の二値データが得られる場合というのは多々あることと思います。連続量だけどデータがどうもよくないので「購入 vs 未購入」に変数変換したという場合などです。 行動実験での時系列データも二値データの場合があるかもしれません。 今回は、二値データ生起確率の時系列推移を推定・定量化してみたいと思います。 例として、「365日のデータで、CVがあった日とCVがなかった日」のデータを想定しました。CVとは、サイトクリックや訪問行動などの目的としたい出来事を指します。 パッケージとサンプルデータの読み込み。 0と1の365個の値、2016年1月1日から12月30日の365個のデータを
Twitterでこの記事をシェアする author: Mr.Unadon (見習い飯炊き兵) 動作環境:Mac OS Sierra 10.12.1; R version3.3.1; rstan 2.10.1 はじめに 児童虐待について考える第一歩。 私にできることと言えば、データをさわって、事実を掴んで、さらに見えない現場を想像すること。 まずはそこからはじめていきたいと思います。 悲しいものは、できれば見たくないものです。 しかし、データを通じて知識を得て、 そこから現場の一瞬一瞬へと想像力を働かせれば、 そこに、あるいはその先に、あたたかい世界が見えてくるかもしれません。 今回は、Poisson-Gammaモデルを用いた階層ベイズで、 都道府県別の児童虐待相談件数の平均 都道府県別の人口に占める児童虐待相談件数の比率 この二つを別々のモデルで推定していきます。 2017.09.08 1
まずはTwitterでこの記事をシェアする author: Unadon (見習い飯炊き兵) 動作環境:Mac OS Sierra 10.12.1; R version3.3.1; rstan 2.10.1 はじめに Rを使う時、私はわざわざ表など使わず、”head(data)”なんかでデータの確認を済ませてしまったりすることが多いです。 でも、他人と共有するとなると、見せ方を考えなければならない。それで、面倒だけどエクセルにコピペして…とやっていました。 また、Rのコンソールに収まりきれないデータを確認したいときなども、何らかの手立てを考える必要があるとおもいます。 今回は、そんなデータの確認に使える”表の出力”についてまとめていきます。 本稿のお品書き package{DT}: dataframeをHTMLの表に一発変換(データが大きい場合有用) package{knitr}: dat
Rによる美しいグラフの作成に欠かせないパッケージ "ggplot2" ですが、 グラフ作成のたびにネット検索したり自分の以前のコードを掘り起こしたりしませんか? author: Unadon (見習い飯炊き兵) 動作環境:Mac OS Sierra 10.12.1; R version3.3.1; rstan 2.10.1 まずはTwitterでこの記事をシェアする はじめに ggplot2のグラフ作成で迷った時、チートシートやマニュアルは役に立つけど援用しにくいんですよね。「何を言ってるのかわからない」っていうのが結構あります。 「軸ラベル」と「軸タイトル」ってどれがどれなん?など、そういう初歩的なところで引っかかったりして、 目的(こういう図にしたい!)と手段(コード)の間の知識を埋めるのが手間で「もうイヤ!」ってなる。 で、次すぐに忘れてる。 なので、頻繁に使用するggplot2の基
このページを最初にブックマークしてみませんか?
『MrUnadon – Bayesian Statistical Modelings with R and Rstan』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く