All slide content and descriptions are owned by their creators.
All slide content and descriptions are owned by their creators.
この記事は、遥か昔のこちらの記事の続きのようなものです。また何度も何度も恐縮ですが、今回の記事内容も付け焼き刃で書いているので色々間違っている可能性があります。お気付きの方は是非ご指摘くださいm(_ _)m 各方面のエコノメトリシャンの方々と上記記事を書いた際に議論*1したことがあるのですが、その時は基本的に統計モデリングを行う際は以下のような判別表に従ってモデルを使い分けるべきだという話になったのでした。 確率分布 特徴 ポアソン分布 データが正の離散値、平均値30ぐらいまで、標本平均=標本分散 負の二項分布 データが正の離散値、平均値30ぐらいまで、標本平均<標本分散 二項分布 データが離散値、ゼロ以上でしかも有限 (0, 1, 2, ... N) 正規分布 データが連続値もしくは離散値でも平均値が十分大*2 (-∞~∞) 対数正規分布 同上、ただし正の値、範囲 (0~∞) ガンマ分布
タイトルの本を頂きました。ありがとうございます。僕は原著を少し読んだことがあり、こちらで非常に評判が高い本です。翻訳にもかかわらず原著とほぼ同じ値段で購入できます。 先にJAGSになじみのない方へ説明しておきますと、JAGSはRコアメンバーの一人でもあるMartyn Plummer氏によってC++で開発されたMCMCソフトウェアです。Rから使うのが多数派ですが、PythonからもPyJAGSによって使うことができます。 複雑なモデルでなければStanより収束が早く、離散値をとるパラメータも使えるため、プログラミングがそんなに得意でない人がベイズ統計モデリングをはじめるには一番向いていると思います。最近、再び活発に開発され始めたようで、先日JAGS 4.3.0がリリースされました。 JAGS 4.3.0 is released https://t.co/3jExabWcPI— Martyn
先日、以下のイベントで話しました。 『StanとRでベイズ統計モデリング』読書会(Osaka.Stan#5) : ATND 発表資料は以下です。 MCMCサンプルの使い方 ~見る・決める・探す・発生させる~ from Kentaro Matsuura 理論的には事後分布や予測分布の使い方というのが正しいですが、プログラミング言語との相性を考えてMCMCサンプルの使い方というタイトルにしました。自著ではモデリングのやり方の体得にフォーカスしていますが、事後分布や予測分布が得られるメリットについては分野や人によって異なるので詳細は省きました。いつか補おうと思っていたので良い機会でした。 読書会では、小杉先生の発表やLTもめちゃ面白く、東京のStan勉強会では見たことがない盛り上がりを見ました。ネット上でしか知らなかったベイジアンにたくさん会って話すことができてよかったです。調子に乗って3次会ま
Rによる美しいグラフの作成に欠かせないパッケージ "ggplot2" ですが、 グラフ作成のたびにネット検索したり自分の以前のコードを掘り起こしたりしませんか? author: Unadon (見習い飯炊き兵) 動作環境:Mac OS Sierra 10.12.1; R version3.3.1; rstan 2.10.1 まずはTwitterでこの記事をシェアする はじめに ggplot2のグラフ作成で迷った時、チートシートやマニュアルは役に立つけど援用しにくいんですよね。「何を言ってるのかわからない」っていうのが結構あります。 「軸ラベル」と「軸タイトル」ってどれがどれなん?など、そういう初歩的なところで引っかかったりして、 目的(こういう図にしたい!)と手段(コード)の間の知識を埋めるのが手間で「もうイヤ!」ってなる。 で、次すぐに忘れてる。 なので、頻繁に使用するggplot2の基
Tutorial R Tutorial ggplot2 ggplot2 Short Tutorial ggplot2 Tutorial 1 - Intro ggplot2 Tutorial 2 - Theme ggplot2 Tutorial 3 - Masterlist ggplot2 Quickref Foundations Linear Regression Statistical Tests Missing Value Treatment Outlier Analysis Feature Selection Model Selection Logistic Regression Advanced Linear Regression Advanced Regression Models Advanced Regression Models Time Series Time Serie
pandas-ply: functional data manipulation for pandas¶ pandas-ply is a thin layer which makes it easier to manipulate data with pandas. In particular, it provides elegant, functional, chainable syntax in cases where pandas would require mutation, saved intermediate values, or other awkward constructions. In this way, it aims to move pandas closer to the “grammar of data manipulation” provided by the
Rodeo (ロデオ) とは、Yhat 社 によって開発されている Python の統合開発環境 (IDE) です。同様の Python 開発環境には、PyCharm (PyCharm のインストール方法) や Eclipse プラグインの PyDev などがありますが、Rodeo は R の開発環境として広く使われている RStudio に似た UI (ユーザインターフェース) を持っているという特徴があります。このため、RStudio に扱いなれている方が Python を扱う際に、Rodeo を利用すると効率よく扱うことができるでしょう。 Rodeo は以下のように、RStudio と同じ画面構成となっていることがわかります。 Rodeo をインストール 本手順では、Windows 10 に Rodeo 2.0.13 (2016 年 8 月現在での最新版) をインストールする方法につ
** Sorry, this note is Japanese only, but please take a look at some code snippets. Hope it helps you a bit! 唐突ですが、このブログの読者のみなさんってどんな環境でコード書いたり データ分析 したりしてるんでしょうか? たぶん、RStudio が一番メジャーかな?で、Jupyter / IPython notebook がそれに続き、以下、Anaconda とも縁の深い Spyder とかなんでしょうか。最近だと PyCharm とか使ってる人もいるのかも。 そんな環境に悩める子羊ならぬ データサイエンティスト のみなさん、(これまで R 使ってる人なら特に)朗報です。 Python のデータサイエンティスト向け開発環境に新しい選択肢「Rodeo」が加わりました。 英語版しかないせい
※この投稿はR Advent Calendar 2016の6日目の記事です。 11/27のJapan.R 2016でLTしたtidyverseについて書きます。スライドは以下です。 Tidyverseとは from yutannihilation (ちなみに、この投稿のタイトルは@siero5335さんのツイートがエモくてすてきだったので勝手に拝借しました。すみません) tidyverseとは 単に「tidyverse」と言ったときに、この言葉が指す対象はいくつかあります。 概念 パッケージ (GitHub上の)組織 あと、誰が運営しているのか分からない謎のTwitterアカウントとかもあるんですが、あれはたぶんただの脇役なので捨ておきましょう。以下、順番に説明していきます。 tidyverse(概念) tidyverseというのは、R界の神として崇められるHadley Wickhamが作
StanのPythonバインディングであるPyStanが公開されて久しいですが、検索してもあんまり情報がヒットしません。ちょっと寂しいと思ったので、インストールやtraceplotの出力なども含めて、以下の本の5.1節「重回帰」の一部を実行してみました(ステマです)。 StanとRでベイズ統計モデリング (Wonderful R) 作者:健太郎, 松浦発売日: 2016/10/25メディア: 単行本 本自体の紹介は以前の記事を読んでいただければと思います。 「StanとRでベイズ統計モデリング」松浦健太郎 という本を書きました - StatModeling Memorandum インストール Windows 7 64bit、Python 3系でのインストール手順を説明します。 AnacondaでPythonなどをインストール コマンドプロンプトからpip install pystanでpy
昨日書いた記事で使ったRパッケージの{rWBclimate}、これは良いものだ、と思えたので別途こうして使い方をメモしておく。 近い将来に予測される大規模な気候変動や乾燥化などを扱った論文が増えているように、気象・気候データは各種の研究やデータ解析において重要となる。局所的なものは自前で気象ステーションとかを設置したりする必要があるのだろうけど、傾向を把握するためにざっくりとした広範囲のデータが欲しい時もある。あるいは日本🇯🇵とか世界全体🌎とかを対象にして議論をしたい時などなど...。 {rWBclimate}はそんな世界中の気象・気候データをR上で取得し、扱うためのパッケージである。開発は信頼と実績のROpenSciが行っている。世界銀行 http://www.worldbank.org が提供している開発者向けのウェブAPIの一種であるClimate Data APIを利用するこ
Tero Alhonen氏のツイートをきっかけにして筆者は、これらの新製品群のリリースを発表しているMSDNのページを見つけることができた。 今回新たに提供が開始されたのは以下の製品だ(いずれも英語版)。 「Microsoft R Server for Hadoop on Red Hat(x64)」 「Microsoft R Server for Teradata DB(x64)」 「Microsoft R Server for Red Hat Linux(x64)」 「Microsoft R Server for SUSE Linux(x64)」 「RRE for Windows(x64)」(RREはおそらく「Revolution R Enterprise」のことだと考えられる。RREの情報をツイートしてくれたMarko Loukkaanhuhta氏にも感謝する) 以下は、MSDN上に記
はじめに dplyrの使い方にちょっと慣れてくると、「あー、これもうちょっと簡単にできないの?」みたいな事が出てきたりします。 今回は、そんな悩みをほんのちょっと解決できるかもしれない、Window関数について解説したいと思います。 SQLに詳しい人はすぐイメージできると思いますが、私の周りにもWindow関数の存在自体を知らない人が結構居たのでいい機会なので、ざっくりまとめます。 dplyrってなんぞやという方は、基礎編の記事を見ていただければと。 Window関数を使うと簡単にできることの例 とは言っても、具体的に何ができるのか、分からなかったら読むのもメンドクサイので、まずは簡単にできることを紹介します。 ランキング(タイ順位考慮あり、なし等含む) 前日比、前週比(前後のレコードとの比較等) 累積(累積和等) 移動平均(Windowサイズの指定、Windowの位置、重み等) どれも自
第50回 TokyoR 発表資料 Stanコードは下のサイトで公開しております。 https://github.com/teuder/TokyoR50 Read less
R-bloggers R news and tutorials contributed by hundreds of R bloggers [This article was first published on HOXO-M - anonymous data analyst group in Japan - , and kindly contributed to R-bloggers]. (You can report issue about the content on this page here) Want to share your content on R-bloggers? click here if you have a blog, or here if you don't. 1. Overview dplyr is the most powerful package fo
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く