タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

統計に関するyue_kのブックマーク (6)

  • http://bdm.change-jp.com/?p=1254

    http://bdm.change-jp.com/?p=1254
    yue_k
    yue_k 2015/07/27
  • 統計学事始め:ダミー変数について

    こんばんは、統計学ド素人のまるごし三平です。 今回はダミー変数 (dummy variable) について簡単に触れておきましょう。 ダミー変数というのは、 ・ある条件を満たす⇒ 1 ・ある条件を満たさない⇒ 0 であるような変数のことを言います。具体的な例として、典型的なものですが、 ・性別を考慮する →女性ならば 1、それ以外は 0 ・市の財政を調査する →政令都市ならば 1、それ以外は 0 といったものです。たいていの場合、質的な情報で二つのカテゴリーに分けることができる(ある条件にあてはまる、あるいは当てはまらない)ものに対して使います。 そして、ダミー変数には ・定数項ダミー ( intercept dummy ) ・係数ダミー ( slope dummy ) があります。これらの効果は、直線の方程式 Yi = ai + bi Xi に対して、 Yi = ( ai + ci )

    統計学事始め:ダミー変数について
  • 決定係数 - Wikipedia

    決定係数(けっていけいすう、(英: coefficient of determination、R2)は、統計学において、独立変数(説明変数)が従属変数(目的変数)のどれくらいを説明できるかを表す値である。寄与率と呼ばれることもある。標値から求めた回帰方程式(モデル)のあてはまりの良さの尺度として利用される。 定義[編集] 一般的な定義[編集] 決定係数 のはっきりと合意された定義は無い。タロル・クヴォルセス[1]によれば、8種類の定義があり注意が必要だとしている[2]。 しかし、以下の式を定義とするのが一般的なようである。標値(実測値、観測値)を 、回帰方程式による推定値を とする。 すなわち、残差の二乗和を標値の平均値 からの偏差の二乗和で割ったものを1から引いた値であり、1に近い程相対的な残差が少ないことを表す。最小二乗法はこの定義を最大にするようなパラメータの選択法である。値域

    yue_k
    yue_k 2015/05/26
  • (おまけ) イラストでわかる自由度と不偏分散 

    文に戻る (おまけ) イラストでわかる自由度と不偏分散 標準偏差を計算するときに、なぜデータ個数ではなく自由度 n-1 を使うの? そもそも自由度って何? というご質問を受ける。 標準偏差の計算と自由度の関係がわかりにくいということで、文にバラバラに書いてあるものを、そこだけまとめなおしてみました。 <不偏分散の公式> 平方和S 不偏分散V=━━━━━━━━ 自由度n-1 不偏分散は 標準偏差 2(σ 2)の最もよい推定値になっています。偏っていないという意味で不偏と名づけられています。いっぽう、平方和をデータ個数で割ると、真の標準偏差値より小さめの数値となります。 標準偏差とは何か (真の平均 μ で算出したとき) 標準偏差とは何かを知るために、まず面積の平均値を計算することからはじめよう。 Q: いろいろな大きさの正方形があります。この平均的な面積の正方形をどうやって描けば いい?

    yue_k
    yue_k 2015/05/25
  • データ & アナリティクス | アクセンチュア

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    データ & アナリティクス | アクセンチュア
    yue_k
    yue_k 2015/05/21
  • 主成分分析の基礎知識

    検索エンジンから直接きたひとは、フレーム目次が便利です。ここは 4章から入ります。 お急ぎで「主成分分析とは」を知りたい方は簡略版へどうぞ。 エクセルで層別散布図・等高線図を描きたい人は(おまけ)へ。 主成分といえば、むずかしそうに聞こえる。でももう君達は高校生のときに学校で教わっているのさ。 X軸とY軸の散布図を書いて、点々の真中ほどに直線を引いたろう?あれが第1主成分。 一番データの点々の広がった部分に直線を引いたはずだね。 第2主成分は、XとYの平均値(重心)を通って、第1主成分である直線に直角の線を引くと出来上がり。 主成分分析の計算過程を数学音痴向けに説明するね。 空中にまとまった点々があるから思い浮かべなさい。カトンボが空中を舞っている姿とか、子魚が群れをなして泳いでいる姿を思い浮かべるのじゃよ。 点々の分布が一番広がったところに、重心をとおってまず最初の直線を引きます。 フラ

    yue_k
    yue_k 2015/05/21
     おバカにもわかりやすい
  • 1