タグ

た多変量解析に関するmidnightseminarのブックマーク (4)

  • 重回帰分析における多重共線性への対処ストラテジーのメモ - Take a Risk:林岳彦の研究メモ

    良い機会なので重回帰分析についてのメモをちょっと残しておきます。 今日のネタはこちら: Excelで学ぶ共分散構造分析とグラフィカルモデリング 作者: 小島隆矢出版社/メーカー: オーム社発売日: 2003/12メディア: 単行購入: 13人 クリック: 152回この商品を含むブログ (9件) を見る私はとってもこのが大好きです!「エクセル」と銘打たれているので敬遠しがちかもしれませんが、かゆいところに手が届いてくる良い説明の多いだと思います。みんな買うとよいと思うなあ。 「マルチコ」と「マルチコモドキ」 このでたいへん勉強になったのは、いわゆる多重共線性(以下マルチコと略)の問題といわれているものの中には実は次の二つが含まれるという話です。 来のマルチコ:ある1つのモデルにおける偏回帰係数の標準誤差の増大 マルチコモドキ:モデルによって偏回帰係数の値が変わるという問題 この「

    重回帰分析における多重共線性への対処ストラテジーのメモ - Take a Risk:林岳彦の研究メモ
    midnightseminar
    midnightseminar 2014/06/10
    重回帰分析の注意点の解説で超わかりやすい。説明変数同士の相関を避けすぎると「得られる偏回帰係数には、外した共変量による擬似相関の効果が加算されてしまいます」
  • 多変量解析(呉海元教授)

    担当教員: 呉 海元 教授 開講セメスター: 3 授業時間: 前期 木曜日 4時限 教室: システム工学部A棟(A103) 単位数: 2 講義の内容と課題 第 1回のPDFファ イル   ガイダンス、プロローグ、多変量解析の応用例、予習テスト 第 2回のPDFファ イル 準備をする(ベクトル、内積、外積) 第 3回のPDFファ イル 準備をする(行列の基的演算、転置行列、逆行列、行列の階数) 第 4回のPDFファ イル 準備をする(2次形式、固有値と固有値ベクトル、ベクトルと行列の微分) 第 5回のPDFファ イル 準備をする(固有値と固有値ベクトル、ベクトルと行列の微分、条件付き最適問題) 第 6回のPDFファ イル  準備をする(平均、分散共分散、相関行列、正規分布) 第 7回のPDFファ イル  原因と結果を探る(予測する)(単回帰分析) 第 8回のPDFファ イル  原因と結果を

    midnightseminar
    midnightseminar 2014/05/25
    和歌山大学の授業のPDFで、とても分かりやすい。主成分分析とか。
  • Microsoft PowerPoint - Lecture_ISM_MV-TS_20100118.pptx

    統計科学の実践と応用 多変量データ解析と時系列解析入門 吉田 亮 (統計数理研究所; モデリング研究系) e-mail: yoshidar@ism.ac.jp スライドのダウンロード: http://daweb.ism.ac.jp/~yoshidar/index_j.htm 1 1 多変量データ解析 サンプル(個体)を特徴付ける変数(特徴変数)が「複数」あるデータセット を分析するための統計技法 (例) 患者(個体)400人の約20,000個の遺伝子の発現量(変数)が計測されました。 どうやって分析しますか? p = 20,000 個の変数 1 1 n = 400人の個体 2 p x1,1 x2 ,1 M xn ,1 x1,2 LLL x2 ,2 LLL x1, p x2 , p 2 n M LLL M xn ,1 LLL xn , p 2 2 多変量デ

    midnightseminar
    midnightseminar 2013/12/25
    いろいろわかりやすい。
  • なぜ項目ごとに単純な集計をするより、多変量解析(重回帰分析)をした方が正確な結果を返すのか - 渋谷駅前で働くデータサイエンティストのブログ

    ちょっと前の記事(単純な集計とデータサイエンスによる分析とで結果がい違うかもしれない3ケース)に裏先生からツッコミを頂き、慌てて学部1年生の頃の教科書を開いて復習しまして。。。いやー、忘れてることが多過ぎて大変(汗)。知るは一時の恥というのをつくづく思い知りましたとさ。当に裏先生ありがとうございました。 ということで、その復習内容の確認と同時に、あの時の裏先生のツッコミ内容をかみくだいて紹介するのも兼ねて、ここはひとつざっくり書いてみようかと思います。 項目ごとの単純集計は「単変量」解析(もっと言えば単相関)に過ぎず、多変量データ全体のことは分からない 前回用いたサンプルデータは、基的にはa1-a7が0or1のみの二値で構成される事実上のカテゴリカルデータ*1で、cvも"Yes"or"No"のみの二値で構成されるカテゴリカルデータです。 で、二値のカテゴリカルデータだけで構成されてい

    なぜ項目ごとに単純な集計をするより、多変量解析(重回帰分析)をした方が正確な結果を返すのか - 渋谷駅前で働くデータサイエンティストのブログ
  • 1