タグ

2018年9月23日のブックマーク (5件)

  • 決定係数の定義と相関係数との関係 | 高校数学の美しい物語

    決定係数は,予測式(回帰式,回帰モデル)の精度を表す値です。 例えば,左側の図では,予測式がデータにうまく当てはまっているので決定係数が大きくなります(決定係数が 111 に近くなります)。 右側の図では,予測式でデータをあまり説明できていないので,決定係数は小さくなります(決定係数が 000 に近くなります)。 決定係数は R2R^2R2 という記号で表されることが多いです。 決定係数 R2R^2R2 の定義はいくつかありますが,以下の式で定義することが多いです: R2=1−∑i=1n(yi−f(xi))2∑i=1n(yi−μY)2R^2=1-\dfrac{\sum_{i=1}^n(y_i-f(x_i))^2}{\sum_{i=1}^n(y_i-\mu_Y)^2}R2=1−∑i=1n​(yi​−μY​)2∑i=1n​(yi​−f(xi​))2​ ただし,(xi,yi)(x_i,y_i)(

    決定係数の定義と相関係数との関係 | 高校数学の美しい物語
    yukirelax
    yukirelax 2018/09/23
    r2 = 1-残差変動 / 全変動
  • スピアマンの順位相関係数 統計学入門

    スピアマンの順位相関係数 相関係数は2変量に直線的な相関関係があれば適用されるが、そうでない場合やデータの順位しか分かっていない場合もあります。そんなときに有効なのがスピアマンの順位相関係数です。求め方は、以下のようになります。下に示すような2変量に関して順位がついています。

  • 26-4. 偏相関係数 | 統計学の時間 | 統計WEB

    次のデータは2015年12月末時点の各都道府県内にある映画館のスクリーンの合計数と可住地面積100当たりの薬局数を表したものです。このデータを用いて相関係数を算出すると、「0.82」でした。つまり、映画館のスクリーン数と薬局の数には強い相関があるという結果でした。 出典:総務省統計局 社会生活統計指標-都道府県の指標-2015 しかし、一般的に考えて都道府県ごとの映画館のスクリーン数と可住地面積100当たりの薬局の数は直接的に関係がないような気がします。映画館のスクリーン数が多いから薬局の出店数が増えるわけでも、薬局の数が多いから映画館のスクリーン数が増えるわけでもないためです。このような場合には、「第3の因子」の存在を考慮する必要があります。

    26-4. 偏相関係数 | 統計学の時間 | 統計WEB
    yukirelax
    yukirelax 2018/09/23
    変相関係数:疑似相関(見せかけの相関)が疑われる場合、第3の因子を仮定し、その影響を取り除いた係数
  • なるほど統計学園高等部 | 統計を学ぶ上で必要な基礎数学

    平均値は変量を全て加えて、データ数で割ったものです。変量 :と するとき、平均値(エックスバー)を式で表すと下のようになります。 例)3年E組の平均登校時刻を求めるとします。この場合、それぞれの登校時刻を、例えば7時を基準として何分後になるかに換算し、それを変量として和を求め、総人数(38人)で割ります。 度数分布表から平均値を求める計算方法 度数分布表からでも階級値(代表値ともいいます。)と度数を用いて平均値を求めることができます。階級の数を、階級値に対する度数(ただし、は変量のデータ数)とします。そしてそれぞれの階級値と度数の積を考えます。これをまとめたものが、以下の表です。

    yukirelax
    yukirelax 2018/09/23
    いろいろな平均
  • 3-4. いろいろな平均 | 統計学の時間 | 統計WEB

    一般的な平均、つまりデータの値を全て足してデータの数で割ったもの、は「算術平均」と呼ばれます。平均にはこの算術平均以外に「幾何平均」や「調和平均」といったものがあります。 ■幾何平均 幾何平均は次の式から求めます。 幾何平均は比率や割合で変化するものに対してその平均を求めるときに使います。例えば過去3年間で家賃が20%、10%、15%上昇したときに、1年で平均何%上昇したかを算出する際に用いられます。 この時の平均は幾何平均の式に当てはめて次のように求められます。(この計算は一般的な電卓ではできませんので関数電卓もしくはExcelで行ってください。)

    yukirelax
    yukirelax 2018/09/23
    幾何平均:比率、割合で変化するものにたいして/調和平均:時速の平均/刈込平均:小さい側と大きい側からそれぞれ指定した個数の値を除き、残ったデータのみから求める平均のことです