[B! statistics] nodatのブックマーク

データ解析その前に: 分布型の確認と正規性の検定 #rstatsj - Qiita

対象としている手持ちのデータが、どのような特徴をもっているかを理解しておくことは、統計解析をおこなう際にとても重要。本当は、データを集める前に理解しておいたほうがいいのだろうけど、どこからともなくやってきたデータと向き合わなくてはいけない場合もあるし、そういうときに心得ておくと良いこと。そんなメモ。多くの統計的検定の手法は、データが正規分布に従うことを仮定している。いわゆるパラメトリック手法といわれるやつ（母集団の分布型に一定の仮定をおく... 正規分布でなくてもおｋ？）がそれだ。データが正規分布に従うかどうか（正規性）を確認する方法は、大きく分けて２つある。度数分布図（ヒストグラム）や正規確率グラフを用いて視覚的に確認するか、統計的手法を用いて客観的な評価をおこなうかである。もちろんRではどちらの方法も実行できるのでやってみる。

nodat 2016/01/04

リンク

モデル選択_理論編 | Logics of Blue

最終更新：2016年1月24日 ※フォントや参考文献などを修正しました予測のためには、実世界をモデル化しなければなりません。モデル化することさえできれば、あとはそのモデルに数値を突っ込むだけで勝手に予測が出来てしまいます。前回（単回帰）は説明変数が一つだけでした。一つの値からまた別の値を予測すると言うだけだったので、どのモデルにすればいいのか、どの変数を使って予測すればいいのか、ということを考えなくても済みました。しかし、実際に予測をする場合は多くの変数を用いたほうが当てはまりもよくなるし、実用的でしょう。どの変数を用いて、どの変数を使わないのか、それを決めるための色々な方法（検定とＡＩＣ）とＲによる計算方法を紹介します。特に最後の方に紹介するパッケージＭｕＭＩｎはお勧めです。簡単にモデル選択ができます。 ※ ２０１５年９月２日にＭｕＭＩｎの使い方を一部修正しました。 ※ コピペ

nodat 2015/12/18

リンク

Rの基本データ構造、よく使う関数紹介 - yasuhisa's blog

Agenda データ構造たくさんある＞＜ベクトル Rの格言いろんなベクトルの作り方規則的データの生成同じデータを繰り返すベクトルへのアクセスの方法アクセス方法にもいろいろあるまだまだあるよ、アクセス方法行列埋めていく順番すでにあるベクトルを束ねる cbind rbind 行列へのアクセス方法行列の基本演算積がやっかい積を求めたいときは「%*%」を使うべし逆行列を求めるちなみに行列式固有値配列リスト例ちなみに unlistのtips リストへのアクセスリストは結構難しい＞＜例リストの要素には名前を付けることができる Rでlistがどのように使われているかデータフレーム例データフレームを作るデータフレームに列を追加と削除データフレームに行を追加因子型 irisのデータでやってみる irisデータ層別にSepal.Lengthの長さ

nodat 2015/08/20

リンク

IBM Developer

IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant techno logies such as generative AI, data science, AI, and open source.