[B! 外れ値][統計] yukirelaxのブックマーク

yukirelax id:yukirelax

外れ値と統計に関するyukirelaxのブックマーク (1)

pandas によるデータセットの加工 (2) - Qiita
昨日は pandas でのデータセット加工について説明しましたがその続きです。データを正規化する実は今までの記事でもさり気なく正規化は登場してきたのですがきちんと説明していなかったと思います。統計における正規化 (normalize) とは、異なる基準のデータを一定の基準にしたがって変形し利用しやすくすることです。たとえば国語が 90 点、数学が 70 点だったとしましょう。単純に数値だけを比較すると国語のほうが成績が良いことになってしまいますが、もし国語の平均点が 85 点、数学の平均点が 55 点だったら果たしてどうでしょうか？このように基準が異なるデータを比較できるようになるといったことが正規化のメリットです。一般的には平均 0 、分散 (及び標準偏差) が 1 になるように値を変換することを指します。これは以下の数式で算出できます。
yukirelax 2018/02/05
pandas

統計

外れ値

正規化

標準偏差
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx