[B! Python][python][machinelearning] babydaemonsのブックマーク

babydaemons id:babydaemons

Pythonとpythonとmachinelearningに関するbabydaemonsのブックマーク (1)

Python: データセットの標準化について - CUBE SUGAR CONTAINER
今回は機械学習とか統計で扱うデータセットの標準化について。まずは、標準化されていない生のデータセットについて考えてみよう。それらの多くは、次元によって数値の単位がバラバラだったり、あるいは大きさが極端に異なったりする。これをそのまま扱ってしまうと、各次元を見比べたときにそれぞれの関係が分かりにくい。また、機械学習においては特定の次元の影響が強く (または反対に弱く) 出てしまったりすることもあるらしい。そこで、それぞれの次元のスケールを同じに揃えてやりたい。これを標準化というようだ。今回は「Zスコア」という標準化のやり方を扱う。これは、一言で言ってしまえばデータセットの各要素から平均を引いて、標準偏差で割ったもの。これをすると、データセットは平均が 0 で標準偏差・分散が 1 になる。使った環境は次の通り。 $ python --version Python 3.5.1
babydaemons 2022/09/02
NumPyを使ったやり方が原始的だけど、今作っているものには都合がいい

python

machinelearning

機械学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx