[B! math][あとで読む] lilpacyのブックマーク

lilpacy id:lilpacy

mathとあとで読むに関するlilpacyのブックマーク (1)

固有値・固有ベクトルの使いみち（１．主成分分析） - Qiita
現代はビッグデータの時代と言われて久しいですが、「データが大きい」と一口に言っても、２種類の大きさがあります。データの次元とサンプルサイズ（N数）です。例えば、「全人類の身長と体重のデータ」なら「次元が小さいけどNが大きいデータ（次元は2、N＝70億）」ですし、「１０人分のゲノム配列データ」なら「次元が大きいけどNが小さい（次元は60億、N＝10）」と言えるでしょう。サンプルサイズがデータの次元より小さいというのは、一般的にデータが不足している状況であり、あまり好ましくありません。たとえば変数の間にある関係を捉えることが難しくなります（回帰における劣決定問題）。しかし、多次元・多変数のデータにおいて、すべての変数が意味を持つということも稀です。幾つかの変数は単に「意味を持たないただのノイズ」だったりします。ゲノムの例でいうと、ヒトゲノムのおよそ97%は無意味なジャンクDNAであると言わ
lilpacy 2021/01/13
あとで読む

主成分分析

math
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx