タグ

2013年12月3日のブックマーク (8件)

  • 多変量解析の主成分分析と因子分析の違いについて教えてください.

    ご質問にある通り、因子分析は「多変量解析」の一分野です。因子分析の手法の一種に主成分分析(principal component analysis)があり、主因子法(principal factor method)とも呼びます。 因子分析に共通しているのは、一つのサンプルから多数の変量を測定する、そういうデータをいっぱい集めて、相関係数という考え方を基にして解析を行う。その際に、ある変量の変動が「他の変量の線形結合(一次式で表される関係)として表せるような系統的変動と、ランダムな変動とから成っている」という仮定を置く。そして共分散行列(もしくは相関行列)を作ってこれを線形変換する。 データの性格や分析の目的によって、手法を使い分けます。 主成分分析では、どの変量とも高い相関を持つ因子(変量の一次式で表される指標)を抽出するという考え方。 同じ因子分析でも、例えばバリマックス法(varim

    多変量解析の主成分分析と因子分析の違いについて教えてください.
  • クックパッドに転職して丸2年が経った

    mirakui's garbage This is an archived post This is an archived post 新卒で入った前職はちょうど2年で辞めたので、社会人生活の半分をすでにクックパッドで過ごしたことになる。 最初はサービス開発エンジニアとして三ヶ月くらいやってたんだけど、その時はあまり自分の立ち位置をうまく作れてなかったと思う。学生の頃からサービスを作る真似事みたいなのはやってきていたけど、いざ現場に入ってみると物のサービスを作れる人たちってのは僕と全然違う。単に技術力ではなく、粘り強さとか、発想の柔軟さとか、そういう人間としての性能が高い。サービスづくりではこの人たちには勝てないと思った。 しかしそういう才能のある人たちがガンガン開発を進めていくといろんな問題が起こることに気づいた。例えばテストをちゃんと書くこと。正しいコードを書くこと。脆弱性に気をつけ

  • R Financial & Marketing Library | R & R Libraries with Mac

    RMeCabパッケージを使用して、RでMeCabを用いて、 形態素解析を行ないます。 そのために、まず MeCab をインストールする必要があります。 MeCab のインストールや設定についてはこちらに記載しております。 RMeCabパッケージを読み込みます。 RMeCabC()関数を使用して、文字列を形態素解析してみます。 文字列は何でもよいですが、 ここではとりあえず、どらちゃんの歌でも入力してみました。 こんな感じで結果が返されます。 次は、RMeCabFreq()関数を使用して、ファイルを読み込んでみます。 こちらは青空文庫から、 夏目漱石さんの「吾輩はである」を使用させていただいております。 青空文庫 夏目漱石 吾輩はである のページ 今回は関数の確認であるため特別な加工をせず、 単純にこのデータをテキストファイルにしています。 ダウンロードのところ

  • ハンバーガー統計学にようこそ!

    |向後研究室ホームへ|次へ→ ハンバーガーショップで学ぶ 楽しい統計学 ──平均から分散分析まで── Web独習教材「ハンバーガーショップで学ぶ楽しい統計学《にようこそ! この教材は、実際に大学の授業で使用したものです。それを一般公開しますので、どうぞお役立てください。 下のメニューに従って1章から7章まで順番に学習していくと、平均から分散分析までを習得することができます。大学の卒業論文レベルで使う統計学として、きっと役立つことでしょう。なお、相関(相関から因子分析まで)については、姉妹編の「アイスクリーム屋さんで学ぶ楽しい統計学《が公開されています。 さあ、がんばって進めていきましょう。 教材メニュー

  • 3.2 カイ二乗値とカイ二乗分布

    3.2 カイ2乗値とカイ2乗分布 ←前へ | もくじ | 次へ→ 観測度数と期待度数のずれを数値にする 平均からのばらつきを数値にするために、分散という考え方を使いました。それと同じように、観測度数と期待度数のずれを数値にすることはできないのでしょうか。それを考えていきましょう。 まず、観測度数と期待度数のずれですから、それらをすべて足してみます。 ずれ案1=(観測度数-期待度数)の総和 しかし、これで実際に計算してみると、 (435-420)+(165-180)+(265-280)+(135-120) =15+(-15)+(-15)+15 =0 となり、常に0になってしまいます。プラスのところとマイナスのところが打ち消し合っているからです。 そこで、分散の計算の時のように2乗してから足していきます。 ずれ案2=((観測度数-期待度数)の2乗)の総和 (435-420)^2+(165-18

  • カイ2乗検定って何??;; - OKWAVE

    こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう. 以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい. χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布とは,二乗値に関する確率分布と考えることができるのですが,この辺もさらりと流して下さい. 例を使って説明します.今,道行く人にA,B,C,Dの四枚のカードの中から好きなもの一枚を選んでもらうとしましょう(ただし,選んでもらうだけで,あげるわけではありません.単にどのカードを選択仕方の情報を得るだけです).一人一

    カイ2乗検定って何??;; - OKWAVE
  • 共分散ってどのように計算されるのですか?また、共分散は数学的にどのような意味を持つのですか? - 共分散ってどのように計算... - Yahoo!知恵袋

    データが(x1,y1),(x2,y2),…,(Xn,yn)で与えられた時、xnの平均をxbar、ynの平均をybarとすると、 xの分散:Σ(xi-xbar)^2/n yの分散:Σ(yi-ybar)^2/n 共分散:Σ(xi-xbar)(yi-ybar)/n で計算されます。 上の二つが一次元データのばらつき方を表すのに対し、共分散は二次元のデータのばらつき方を表すといえるでしょう。また、分散は必ず0以上の値をとるのに対し、共分散は正の数にも負の数にもなり得ます。この値が正の数か負の数かで、二つのデータが正の相関関係にあるか負の相関関係にあるかがわかります。

    共分散ってどのように計算されるのですか?また、共分散は数学的にどのような意味を持つのですか? - 共分散ってどのように計算... - Yahoo!知恵袋
  • ゆりゆり ピアソンの積率相関係数