タグ

主成分分析に関するmahler-5のブックマーク (13)

  • 主成分分析(R) - 突然終わるかもしれないブログ

    PRML(12章)のまとめです. 観測値 $\{x_n\}_{n=1}^N\subset \mathbf{R}^D$ があるとき,$u_1\in\mathbf{R}^D$への観測値の射影が最大になるような $u_1\in\mathbf{R}^D$ を探すことを考えます. $u_1$ は観測値 $\{x_n\}_{n=1}^N$ の一番の【特徴】を表す方向であると考えられます.極端な例でいうと,$u_1$ 方向に射影したとき観測値がすべて一点に集約されてしまっては,観測値の持っている情報は無くなってしまうと考えられます.そこで射影したときに射影した観測値の分散が最大になる方向は,射影したときの観測値の情報を最大限保持する方向であると考えられます. $u_1$だけでなく,$u_2,\ldots, u_M$まで同様に考えて,$D$次元の観測値$\{x_n\}_{n=1}^N\subset \ma

    主成分分析(R) - 突然終わるかもしれないブログ
  • 「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料

    「第5回 プログラマのための数学勉強会 発表資料 (2015/11/21[sat])」 内容は統計学の素養がある方には基的な事項ですが、ベクトルと内積で見方を変えてみたという点と、あまり統計学に親しみがない方にも理解してもらえるようなまとめになっている、というところにスライドの独自性があると考えていますので、その辺り良ければご覧ください^^Read less

    「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
  • [R] Gaussian Process Latent Variable Models (GPLVM) を使ってみる

    日々、スポットライトがあたっていない良ライブラリを見つけては紹介したいと思っています。スポットライトのあたっていない良若者も然りです。おせっかいおじさんです。今日はPCA(主成分分析)のド発展版に相当する、ガウス過程を用いたGPLVMをRからサクッと使うまでの備忘録です。 GPLVMの説明で分かりやすいのは、以下の統計数理研究所のH26年度公開講座「ガウス過程の基礎と応用」の持橋先生と大羽先生の発表資料です。 [1] 統計数理研究所 H26年度公開講座「ガウス過程の基礎と応用」 (web) 元論文は以下です。 [2] M. K. Titsias and N. D. Lawrence (2010) Bayesian Gaussian Process Latent Variable Model. Thirteenth International Conference on Artificial

    [R] Gaussian Process Latent Variable Models (GPLVM) を使ってみる
  • 勉強会:主成分分析・因子分析(金明哲『Rによるデータサイエンス』) - StatsBeginner: 初学者の統計学習ノート

    今回の勉強会 こないだの日曜日は友人とやっている週次の統計勉強会で、金明哲『Rによるデータサイエンス』の主成分分析の章と因子分析の章を扱いました。 Rによるデータサイエンス - データ解析の基礎から最新手法まで 作者: 金明哲出版社/メーカー: 森北出版発売日: 2007/10/13メディア: 単行(ソフトカバー)購入: 36人 クリック: 694回この商品を含むブログ (59件) を見る 多変量解析の教科書で理論的な学習は終えた上で、演習としてRでの分析を実行してみるという位置づけです。主成分分析と因子分析についての理論的な説明も、一応この教科書に少し書いてありますが、基的にはRの演習がメインの教科書なので、考え方や数式の展開などの解説は別書で読むべきでしょう。(我々の勉強会では、永田・棟近『多変量解析入門』を使用しました。過去のエントリ参照。) なお、次回の勉強会では永田・棟近『多

    勉強会:主成分分析・因子分析(金明哲『Rによるデータサイエンス』) - StatsBeginner: 初学者の統計学習ノート
  • (おまけ) 早わかり 主成分分析 

    第4章 文に戻る 第2章 主成分分析の使用事例へ (おまけ) 早わかり 主成分分析 主成分分析は英語では PCA: Principal Components Analysis といいます。 主成分分析だけだと、それは主成分スコアの計算方法です。 一般に言葉では次のように説明されます。すべて同じことの説明です。 説明変量の圧縮 多変数から少数の総合的指標にする 多変数から少数の合成変数にする データの低次元化 データの圧縮または縮約 情報の簡素化・要約 現在では主成分分析はその計算結果につづけて他の手法に使うのがふつうです。こうしたその他の手法まで含めて主成分分析としてあつかわれます。 <主成分分析で行うこと> これまで 主成分スコアの計算 これから 多変数から複数のメカニズムの分離(主成分スコアの計算と同じ。利用目的が異なる) メカニズム提示(因子負荷量と相関方向) 主成分回帰(単純な曲

  • 湿地福利院|湿地福利院有限公司

    湿地福利院,又黄又爽又刺激又色的视频,又黄又爽又高潮的免费视频,又黄又爽又高潮又无遮挡,又黄又爽又过瘾的免费漫画,又黄又爽又猛的视频免费,湿地福利院,国产精品推荐制服丝袜,全网国产、日韩、欧美、各类影视又粗又硬又黄又爽免费的视频,湿地福利院,少妇大叫好大好爽要去了,少妇厨房愉情理伦片视频。

  • Google Sites: Sign-in

    Not your computer? Use a private browsing window to sign in. Learn more

  • Rによる主成分分析 入門

    機械学習における主成分分析について説明するとともに、実際のデータを用いた処理について説明しました。 2018-05-17 誤字修正のため、再アップ それまでのログ:view: 6934, like 4, download: 35

    Rによる主成分分析 入門
  • 主成分分析の基礎知識

    検索エンジンから直接きたひとは、フレーム目次が便利です。ここは 4章から入ります。 お急ぎで「主成分分析とは」を知りたい方は簡略版へどうぞ。 エクセルで層別散布図・等高線図を描きたい人は(おまけ)へ。 主成分といえば、むずかしそうに聞こえる。でももう君達は高校生のときに学校で教わっているのさ。 X軸とY軸の散布図を書いて、点々の真中ほどに直線を引いたろう?あれが第1主成分。 一番データの点々の広がった部分に直線を引いたはずだね。 第2主成分は、XとYの平均値(重心)を通って、第1主成分である直線に直角の線を引くと出来上がり。 主成分分析の計算過程を数学音痴向けに説明するね。 空中にまとまった点々があるから思い浮かべなさい。カトンボが空中を舞っている姿とか、子魚が群れをなして泳いでいる姿を思い浮かべるのじゃよ。 点々の分布が一番広がったところに、重心をとおってまず最初の直線を引きます。 フラ

  • 統計学入門−第17章

    この章では因子の意味と因子分析の原理、そして結果の解釈方法について解説します。 さらに因子分析の結果を利用した尺度開発の方法と、主成分分析と因子分析の使い分けについても解説します。 17.1 因子と因子分析 (1) 主成分と因子 第16章の主成分分析では互いに相関が高い国語と英語と社会がひとつの学力を反映していて、数学と理科がそれとは別のもうひとつの学力を反映していると考え、これに基いて主成分を解釈しました。 このことから学力には2種類の基的なものがあり、そのひとつが国語と英語と社会のテスト結果を左右し、もうひとつが数学と理科のテスト結果を左右すると考えることができます。 逆に言えば、これらの潜在的な学力を調べるために、それを反映すると思われる複数の教科のテストをしていると考えても良いと思います。 このように直接的には観測できないものの、色々な観測値に影響を与える潜在的な要因のことを因子

    統計学入門−第17章
  • 文系のための「擬逆行列」

    さて、前回の話の最後に、「逆行列」というをやった。 「逆行列」というのは、スカラーの「逆数」に対応し、 元の行列に、逆行列を掛けると、「単位行列」が出てくるのであった。 覚えていない人は、もう一度、逆行列の投稿を参照すること。 この投稿の最後に、「逆行列」が「正方行列」でないといけない、と言った。 ところが、この「正方行列」という制限は、色々と不便なのである。 しかし、方法が無いかと言われると、そうでもない。 近似的に「逆行列」を求める方法がある。 っと、いうことを今日は書いてみる。 では、早速、「R」を使って、この問題に挑戦してみる。 まずは、4行×3列の行列を準備する。つまり、n=4、p=3 の行列である。 「R」を立ち上げたら、次のように入力する。 A <- matrix(c(50,0.5,50,5,7,0.2,0,6,75,3,20,50), nrow=4, ncol=3) 今回は

  • Pythonで主成分分析 - old school magic

    概要 主成分分析(Principal Component Analysis, PCA)とは、 データの無相関化 データの次元の削減 を行う手法です。 簡単に言うと、データを分析しやすいように再構成し、可能なら次元を下げることです。 なぜ次元を削減する必要があるかと言うと、機械学習や統計において、データの次元が大きすぎると認識精度が悪くなる、次元の呪いという現象を回避するためです。 (2次元や3次元に変換できると可視化できる、というメリットもあります。) 今回は、Pythonを使って主成分分析を試してみようと思います。 主成分分析の例 ライブラリとしてscikit-learn、テストデータとしてiris datasetを用います。 scikit-learnはPython機械学習ライブラリです。主成分分析も実装されています。 導入等については、次の記事をご参照ください。 MacPython

    Pythonで主成分分析 - old school magic
  • R言語で学ぶマーケティング分析 競争ポジショニング戦略

    5. 自己紹介 ◆ 統計解析やデータマイニングをビジネスに適用 ◆ 里 洋平(@yokkuns) ◆ 元Webエンジニアのデータサイエンティスト ・今は主にマーケティング周りを見てる ・時系列解析とか異常検知とか最適化とか ・いろんなモデルの構築 ◆ Tokyo.Rの主催者 2013年6月1日土曜日

    R言語で学ぶマーケティング分析 競争ポジショニング戦略
  • 1