タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

Rと統計に関するyubessyのブックマーク (2)

  • Quick-R: Power Analysis

    For each of these functions, you enter three of the four quantities (effect size, sample size, significance level, power) and the fourth is calculated. The significance level defaults to 0.05. Therefore, to calculate the significance level, given an effect size, sample size, and power, use the option "sig.level=NULL". Specifying an effect size can be a daunting task. ES formulas and Cohen's sugges

  • サンプリング時の最適なサンプルサイズをRパッケージ{pwr}で求める - 渋谷駅前で働くデータサイエンティストのブログ

    最近、「ビッグデータ」というバズワードに対するアンチテーゼとして叫ばれるようになってきたのが、 「統計学ってのは限られたサンプル(抽出)データから、まだ見ぬ全体像を知るためのもの」「だからビッグデータなんて苦労して集める必要はない、サンプリングされたデータだけで十分だ」 という主張。えーと、半分はその通りだと思います。けれども、半分はそうでもないかなぁ、と。 何故なら、レコメンダーとかSPAMフィルタなどのバックエンドシステム開発では、できれば全数データを使って可能な限り精度を上げ続けた方が良いものが多いからです。だからHadoop以下大規模分散処理などの高度な手法を沢山駆使しているわけで、そこでは依然として全数データは非常に重要です。 一方、マーケティングなどでオフライン&アドホックで分析する際には、そこまでやらんでもええやん的な状況は多くあります。手動でデータ分析したいんだけど、全数デ

    サンプリング時の最適なサンプルサイズをRパッケージ{pwr}で求める - 渋谷駅前で働くデータサイエンティストのブログ
  • 1