タグ

クラスタリングに関するushi168のブックマーク (2)

  • Python, pandas, seabornでペアプロット図(散布図行列)を作成 | note.nkmk.me

    Pythonのビジュアライゼーションライブラリseabornとpandasを使うと、ペアプロット図(散布図行列)を簡単に作成できる。 seaborn.pairplot()関数を使う。 seaborn.pairplot — seaborn 0.8.1 documentation 第一引数にpandas.DataFrameを指定するだけで各列同士の散布図がマトリクス上に配置されたペアプロット図が作成できる。対角線にはヒストグラムが配置される。 Irisデータセットを例に、各種引数による設定などを説明する。 Irisデータセット seaborn.pairplot()関数の使い方とデフォルト設定 カテゴリデータに従って色分け: 引数hue カテゴリの順番を指定: 引数hue_order カテゴリの色を指定: 引数palette グラフ化する列を指定: 引数vars, x_vars, y_vars

    Python, pandas, seabornでペアプロット図(散布図行列)を作成 | note.nkmk.me
  • Python: KMeans 法を実装してみる - CUBE SUGAR CONTAINER

    KMeans 法は、機械学習における教師なし学習のクラスタリングという問題を解くためのアルゴリズム。 教師なし学習というのは、事前に教師データというヒントが与えられないことを指している。 その上で、クラスタリングというのは未知のデータに対していくつかのまとまりを作る問題をいう。 今回取り扱う KMeans 法は、比較的単純なアルゴリズムにも関わらず広く使われているものらしい。 実際に書いてみても、基的な実装であればたしかにとてもシンプルだった。 ただし、データの初期化をするところで一点考慮すべき内容があることにも気づいたので、それについても書く。 KMeans 法の具体的なアルゴリズムについてはサンプルコードと共に後述する。 今回使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.12.3 BuildVersion

    Python: KMeans 法を実装してみる - CUBE SUGAR CONTAINER
  • 1