サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
大谷翔平
blog.goo.ne.jp/r-de-r
Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 ご注意: 2021 年 2 月における R 4.0.4 での話ではありませんから。 RStudio Version 1.1.456 を立ち上げると, During startup - Warning messages: 1: Setting LC_CTYPE failed, using "C" 2: Setting LC_COLLATE failed, using "C" 3: Setting LC_TIME failed, using "C" 4: Setting LC_MESSAGES failed, using "C" 5: Setting LC_MONETARY failed, using "C" と出て,案の定,日本語を含むプログラムを読み込むと,文字化けしている。 もう,こ
Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 これも,非公開にされたのね。リンク切れになちゃった。 確かに,不都合な事実は消去したいというのはもっともだとは思うのだけど。不十分でしたと潔く振る舞うのもブシノスガタではないかな? http://my-notes.hatenablog.com/entry/2017/09/15/173257 | My Notes | 統計学とかR(R言語)とかPython3とかプログラミングとかの覚え書きとか走り書きとか。 座右の銘にしたい: All work and no play makes Jack a dull boy. | 2017-09-15 | R(R言語) ノンパラメトリック検定(独立サンプルの比較、独立した2群の中心位置の比較、Mann-Whitney (マン・ウイットニー) 検定(U
Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 http://abrahamcow.hatenablog.com/entry/2014/09/11/024924 「時系列データの相関係数はあてにならない……のか? 教えて下さい」なんだけど... 私のコメントが気に触ることが多いようなのですが(特に悪意はないつもりなんですけど,すみませんね) 私は,経済学とか時系列についてはよく知らないのですが,「これは「見せかけの相関(擬似相関;spurious correlation)」の例だ」ということならば,偏相関係数を考えればよいのではないでしょうかね??社会学などでは当たり前のように使われていると思うのですが。 > set.seed(1) > x = cumsum(rnorm(100)) > set.seed(2) > y = cumsu
Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 筆者が恥ずかしかったのか,今では非公開扱いになってしまって,ほかの人が閲覧できなくなっている。 で, 「ダイナマイト・プロットとはこのページにある最初のグラフのようなもの。」 というのが意味不明(参照不能)になっているので,「ダイナマイトプロットって何?」に答えておこう。 まあ,以下のようなもの。昔の漫画(若い人には分かるまい)のダイナマイトの点火装置(上のバー)を押すとダイナマイトが爆発するというような図である。こういうと,今の若い人にも「だせ〜〜〜〜」とわかるだろう。 というのが捕捉で,以下が当時の記事。 ============================================================================= http://abra
Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 「A/Bテストの数理」への批判 http://abrahamcow.hatenablog.com/entry/2013/12/28/210035 だけどねえ。ちょっといただけない。 ではこの場合、有意水準はいくつくらいにしたらいいんでしょうか? とてもよい質問です。 たぶん20%くらいでいいんじゃないかと思います。 その根拠は天気予報です。 降水確率0%~20%くらいならだいたいみんな傘持ってかないじゃないですか。 40%~100%ならだいたいみんな傘持っていくんじゃないでしょうか。 30%だと人によってはちょっと迷うと思います。 だから20%で切っちゃいましょう。 そのくらいのざっくりした感じで十分だと思います。 有意水準は,リスク・ベネフィットの観点を考慮するというのはあたりまえな
Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 「単純な集計とデータサイエンスによる分析とで結果が食い違うかもしれない3ケース」なんだけど... 結論は別によいのだけど,基礎が危ういなあと思うので一言。 筆者は, 世の中には、単純な四則演算での集計結果と、データサイエンスを駆使した分析結果とで、食い違ってしまうケースが何故かあることが知られています。どちらかと言うとレアケースだとは思いますが、その矛盾をおざなりにするととんでもないことになることも多々ありますので、 と書いていて,「何故かある」と本質が分かっていないような書きぶりなのです。 これは,多変量解析では当たり前なことです。多変量解析の結果は,単変量(より低次元)の分析結果からは推測できないということ。件のデータも,cv が yes/no 別に a1~a7 の変数 0/1 の
> 2013-04-20 > TokyoR#30に参加してきた > 2.分散分析(@aad34210さん) > 2つ以上の平均値を比較するための統計的手法(2つの場合はt検定) > 主効果と交互作用効果 > rep関数は繰り返せ > aov関数が分散分析 > interactionm.plotで図示できる ここでは,何回も指摘しているように,3群以上の平均値の差の検定を行う関数は oneway.test を使うべし。 aov 関数は「普通の一元配置分散分析」,R の特徴である,「独立2群の平均の差の検定の t.test では,デフォルトで var.equal=FALSE がデフォルト」ということに対応しているのは,oneway.test。デフォルトで Welch の方法に従う(var.equal=FALSE)。そもそも,aov には等分散性についての引数はない。 よくまあ,aov 関数なん
Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 「ggplot2:scale_shape_manual ggplot2メモ:水準を形で分ける」において,以下のようなグラフを描いている。 水準が9個あり,色や線種を変えて折れ線グラフを描くと見にくいということで,記号も付けて描いたということだが,本当に見やすいのか?例えば,この折れ線の中から日本がどれなのか,探すのは簡単か? 簡単でない理由は,折れ線の凡例が本体と分離されているからだ。凡例が枠外にあるからではない。 以下のような,標準の matplot を使って描いた図と比べれば,差は一目瞭然。 見た目が派手(きれい?)なグラフを描くことに腐心するより,見やすいグラフを描くようにしたいものだ。パワポで見せびらかすにはよいかも知れないが,学会誌に ggplot2 で描いたような図は載らな
Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 「おっぱい関数」を材料として3次元表示についてまとめる。 「おっぱい関数」は元々誰が作ったか不詳だが,検索すると Julia + Excel http://www.hirax.net/diaryweb/2012/03/01.html Maxima https://plus.google.com/u/0/117731699005945352808/posts/Yswj5tswtNd などが引っかかる。変形したものもある。 Python http://kemeconoajito.blog88.fc2.com/blog-entry-175.html R によるものは,http://siguniang.wordpress.com/2011/11/09/3d-surface-plot-with-
Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 相変わらず,この記事が参照されるようで。 以下のプログラムを見て分かる人はそもそも,こんな記事を読みに来るとも思えないので,一応,式を書いておきましょうかねぇ。 二点 (x1, y1) と (x2, y2) を通る直線と,もう二組みの点 (x3,y3) と (x4,y4) を通る直線の交点の座標 (x,y) は,まず, a1 = (y2-y1)/(x2-x1) a3 = (y4-y3)/(x4-x3) を計算して,その後, x = (a1*x1-y1-a3*x3+y3)/(a1-a3) y = (y2-y1)/(x2-x1)*(x-x1)+y1 ということです。下のプログラムそのまんまですね。。。下の方に追記 (x1,y1)と(x2,y2)を通る直線と,(x3,y3)と(x4,y4)を
特に,整数値など限られた値を取る変数の散布図は,プロット点の重なりが表現できないので,jitter を使う方法が紹介されるが,jitter も使いようで誤解を与えるので,以下のような方法を。色の濃さで重なりがわかる。8 桁の 16 進数の下位 2 桁がαチャネル。 plot(ToSleep, hours.of.sleep, col="#ff000010", pch=19)
Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学 いやいや,ここなんか問題外ですね。素晴らしいブログがいっぱいあります。 統計ソフトRのブログ http://rbloger.blog51.fc2.com/ hamadakoichi blog http://d.hatena.ne.jp/hamadakoichi/ パソコンや自然科学っぽい話題 http://math-sci.blog.so-net.ne.jp/archive/ Yukun's Blog http://www.yukun.info/blog/category/r 足軽日記: 統計/R http://martesorex.cocolog-nifty.com/blog/r/index.html 太田和志 研究室Blog::統計ソフトRを試す http://kazlab.jpn
このページを最初にブックマークしてみませんか?
『blog.goo.ne.jp』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く