タグ

R言語に関するgorimaru7のブックマーク (3)

  • Rとブートストラップ

    統計学の主な目的の1つは、標データを用いて母集団の性質を推測することである。同じ母集団から抽出した標であっても、無作為であるため標を構成する要素、標のサイズが異なると、それらの統計量(比率、平均、分散など)は異なる。従って、標データを用いて母集団の性質を推測する際には常に誤差が伴う。 正規分布N(μ,σ2)の母集団から抽出した大きさnの無作為標の平均はN(μ,σ2/n)に従うことが知られている。σは一定の条件のもとでは標の不偏標準偏差を用いることも可能である。このように正規分布、t分布、x2分布などの確率分布を用いて母数やモデルの推定およびその推定の誤差を計算することができる。しかし、問題によっては確率分布を仮定できないケースも少なくない。そこで、1970年代にエフロン(Efron)は確率分布の性質に頼らないブートストラップ(bootstrap)という方法を提唱した。ブート

    Rとブートストラップ
  • R Resampling (リサンプリング) - DSL_statblog

    ゼミでリサンプリングの手法を学んだので、知識と各手法の善し悪しについて整理しておく。主にこちらのサイトを参考にした。 リサンプリングの定義 初期サンプルから、新しいサンプルを作りだすことに基づいて得られる統計的推定の方法 リサンプリングの目的 1. 推定量のバイアスを低減する(Jackknife, Bootstrap) 2. 正規分布を仮定せずに、信頼区間を推定する(Bootstrap) 3. 正確な検定を行う(Permutation test) 4. モデルの精度検証を行う(Cross Validation) 代表的な手法 1. Jackknife - n個のデータのうち、k個を抽出し、残りn-k個のデータで統計量の算出やモデルの作成を行う。抽出するk個の全パターンについて、この操作を繰り返す - 外れ値の検出に用いられる - 一般的に分散や共分散の推定にも使われる - 推定量のバイアス

    R Resampling (リサンプリング) - DSL_statblog
  • マイクロソフト、統計解析言語Rの商業ベンダーRevolution Analyticsを買収

    Mary Jo Foley (Special to ZDNET.com) 翻訳校正: 編集部 2015-01-26 10:52 MicrosoftがR言語のソフトウェアとサービスを提供するRevoluton Analyticsを買収したことを発表した。R言語は統計的計算や予測分析向けのプログラミング言語。買収金額は公開されていない。 MicrosoftがRevolution Analytics買収を発表したのは1月23日。同社は会計年度2015年第2四半期の決算報告を26日に予定しており、その数日前の買収発表となった。 Revolution AnalyticsはR言語ベースの分析ソリューションの開発と実装のための「エンタープライズ級のプラットフォーム」を提供するベンダーで、買収を発表したMicrosoftのブログによると、大規模なデータウェアハウスやHadoopシステムなどとも連携し、業務

  • 1