エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
タイタニックデータで主成分分析してみた! - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
タイタニックデータで主成分分析してみた! - Qiita
概要 kaggleで初めによく利用されるタイタニックデータを用いて、 主成分分析をしてみました。 但し、今... 概要 kaggleで初めによく利用されるタイタニックデータを用いて、 主成分分析をしてみました。 但し、今回は、予測することを目的として行ったのではなく、 単に統計分析手法を用いて、データの特徴などを観察することを目的として行いました。 なので、train/testデータをまとめて主成分分析した次第です。 前提 主成分分析とは? 複数の軸(変数)で表現されるデータに対して、 "データのバラつき度が高くなる軸"を見つける手法。 予測の際は次元圧縮のため、 既存データの分析の際は要約のために行われることが多い。 下図(イメージ図)では、 バラつきが最も高い赤軸、次に(赤軸に直交し)バラつきが高い青軸がある。 このような赤軸、青軸を見つけるのが主成分分析である。 分析_概要 分析データ タイタニックデータ(train + test)。 下記(kaggle)よりダウンロードできます。 (但し、ka