タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

Pythonとpythonとmachinelearningに関するbabydaemonsのブックマーク (1)

  • Python: データセットの標準化について - CUBE SUGAR CONTAINER

    今回は機械学習とか統計で扱うデータセットの標準化について。 まずは、標準化されていない生のデータセットについて考えてみよう。 それらの多くは、次元によって数値の単位がバラバラだったり、あるいは大きさが極端に異なったりする。 これをそのまま扱ってしまうと、各次元を見比べたときにそれぞれの関係が分かりにくい。 また、機械学習においては特定の次元の影響が強く (または反対に弱く) 出てしまったりすることもあるらしい。 そこで、それぞれの次元のスケールを同じに揃えてやりたい。 これを標準化というようだ。 今回は「Zスコア」という標準化のやり方を扱う。 これは、一言で言ってしまえばデータセットの各要素から平均を引いて、標準偏差で割ったもの。 これをすると、データセットは平均が 0 で標準偏差・分散が 1 になる。 使った環境は次の通り。 $ python --version Python 3.5.1

    Python: データセットの標準化について - CUBE SUGAR CONTAINER
    babydaemons
    babydaemons 2022/09/02
    NumPyを使ったやり方が原始的だけど、今作っているものには都合がいい
  • 1