タグ

ブックマーク / funmatu.wordpress.com (2)

  • 階層的クラスタリング

    階層的クラスタリングってseaborn.clustermap()で ちょちょっとグラフをみる位しかしない為, この辺の話はあまり知らないので改めて. 「scipy.cluster.hierarchy.cut_tree」はカットされた木を返す. 要はクラスタを返すという事だろうか. どうも,バグが多そう……. Alternative for scipy.cluster.hierarchy.cut_tree() – StackOverflow データが持つ情報が不明なのでよく分からない. %matplotlib inline import matplotlib.pyplot as plt import seaborn as sns import numpy as np from scipy.cluster.hierarchy import linkage, is_valid_linkage,

    階層的クラスタリング
    sh19910711
    sh19910711 2021/04/18
    seaborn.clustermap
  • 無条件に「正規化すべし」というのはどうだろうか

    統計学では,正規化(Normalization)も標準化(Standardization)も同様の意味で用いられる事が多いが,機械学習データ分析の世界では,標準化は正規分布→標準正規分布を指し,正規化はデータを[0, 1]にリスケーリングする事を指す場合が多いので,ここでは後者の意味で用いる事にする.標準化については,これは言うまでもなく,非常にパラメトリックな話で,議論の余地は無いだろう.問題になるのは後者で,正規化はデータプリパレーション時に,非常に重要なプロセスだけど,何をしたいのか,目的によって,当に正規化した方が良いのかどうかというのは,やはり考えないといけないのではないか.何でもかんでも,無条件に正規化するべし,みたいな論調があるけど,そうではない(例えば,手法によっては,手法自体に中心化のバイアスがあって,その場合はプリパレーション時に正規化(というかその場合は「標準化」

    無条件に「正規化すべし」というのはどうだろうか
  • 1