タグ

2016年8月31日のブックマーク (3件)

  • Rでファイ係数 | 統計 | 一言茶屋 ~元SEのつぶやき~

    Rでのファイ係数の求め方 まずはデータを0と1に変換する必要があります。 ifelse関数を利用して、「好き」の場合1に、それ以外(嫌い)の場合0に変換します。 「==」は一致の判定に利用します。「=」の場合は代入になるので気を付けてください。 数学だけでなく、国語のデータについても同様に変換します。 その後、cor関数を利用して、ファイ係数を求めます。 今回はファイ係数が「0.2182179」なので、「弱い正の相関あり」となります。 つまり、「数学が好きな生徒が国語も好きと答える傾向にある」と言えます。 (とはいえ、ファイ係数が小さいので、数学好きと国語好きの相関はあまりないですけど) 最後に ファイ係数は、クロス集計で集計した結果の参考となる数値です。 しかし、実際はクロス集計表の度数を見て、様々な仮説を仮説を立てることが大切です。 ではでは。

  • A Simple Machine Learning Method to Detect Covariate Shift

    Building a predictive model that performs reasonably well scoring new data in production is a multi-step and iterative process that requires the right mix of training data, feature engineering, machine learning, evaluations, and black art. Once a model is running “in the wild”, its performance can degrade significantly when the distribution generating the new data varies from the distribution that

    A Simple Machine Learning Method to Detect Covariate Shift
  • さまざまな確率分布 probability distributions - 数理的思考 - 中川雅央 【知と情報の科学】

     さまざまな確率分布 probability distributions - 数理的思考 - 中川雅央 【知と情報の科学】 ■ さまざまな確率分布 (probability distributions) 観測される現象は,確率的に変動するものが多いと考えられます.その観測されたデータを説明する統計モデルに,どの確率分布を使えばうまく説明できるでしょうか. 正規分布や二項分布など,確率分布の種類は数多く,いろいろなカタチ(分布形)があります.確率分布の当てはめを考えるには,そのカタチ(分布形)を知ることが重要です.各確率分布の母数(パラメータ)によってそのカタチ(分布形)が決まります.確率変数には離散型と連続型があり,その範囲もさまざまです. このページは,代表的な確率分布について,それらを比較・検討しやすいように母数(パラメータ)やグラフ等を一覧表にまとめたものです. 1. 離散型確率分