ブックマーク / www.haya-programming.com (2)

  • 【python】scipyで階層型クラスタリングするときの知見まとめ - 静かなる名辞

    はじめに scipyの階層型クラスタリングを使う機会がありましたが、使い方がわかりづらいと思ったのでまとめておきます。 目次 はじめに 関数がいっぱいある 使い方 linkage fcluster cophenet dendrogram 実践編 データを作る 手法を選ぶ クラスタに分ける デンドログラムを描く 遊ぶ まとめ 関数がいっぱいある いっぱいあるんですよ。 Hierarchical clustering (scipy.cluster.hierarchy) — SciPy v1.3.0 Reference Guide 私の数え間違えがなければ31個。多いですね。 とはいえ、質的なもの(実際によく使うもの)は以下くらいです。 linkage 実際に階層型クラスタリングを行う。これがないと始まらない。 fcluster 任意の深さで木を切り、クラスタに分割する。 cophenet y

    【python】scipyで階層型クラスタリングするときの知見まとめ - 静かなる名辞
  • 【python】scipyのpdistとsquareformの使い方と仕組み - 静かなる名辞

    はじめに scipyで距離行列を扱うときはscipy.spatial.distanceのpdist, squareformなどを主に使いますが、長年よくわからないままに使っていたので、整理してまとめておきます。 なお、以下のドキュメントを参考にします。 scipy.spatial.distance.pdist — SciPy v1.2.1 Reference Guide scipy.spatial.distance.squareform — SciPy v1.2.1 Reference Guide pdist pdistを使うと様々な距離の距離行列を計算できます。デフォルトはユークリッド距離ですが、他にもいろいろ指定できる距離の種類があります。詳細はドキュメントを見てください。 そしてpdistは「condensed distance matrix」という表現方式の距離行列を返します。この

  • 1