タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

クラスタリングに関するssm_kariyaのブックマーク (2)

  • Python:クラスタリング分析 : 分析技術とビジネスインテリジェンス

    Python Orangeを用いたクラスタリング分析についてまとめる。クラスタリング分析はアンケートの回答データや、顧客行動データのパターン抽出などによく用いていた。データに存在するいくつかのパターンを感じられるだけでも実務では安心できるので、特に初期分析で重宝している。 ■ライブラリ >>> import Orange ■分析データ >>> adult = Orange.data.Table('./data/adult.txt') #質的変数混在でも欠損データがあっても処理可能 ■クラスタ分析の実施 まずは、クラスタ数3、初期重心をランダム(デフォルトのため特にコーディング不要)としてKmeansを実施をした。 >>> km = Orange.clustering.kmeans.Clustering(adult, centroids = 3) >>> print km.clusters[

  • 軽量データクラスタリングツールbayon - mixi engineer blog

    逆転検事を先日クリアして、久しぶりに逆転裁判1〜3をやり直そうか迷い中のfujisawaです。シンプルなデータクラスタリングツールを作成しましたので、そのご紹介をさせていただきます。 クラスタリングとは クラスタリングとは、対象のデータ集合中で似ているもの同士をまとめて、いくつかのグループにデータ集合を分割することです。データマイニングや統計分析などでよく利用され、データ集合の傾向を調べたいときなどに役に立ちます。 例えば下図の例ですと、当初はデータがゴチャゴチャと混ざっていてよく分からなかったのですが、クラスタリングすることで、実際は3つのグループのデータのみから構成されていることが分かります。 様々なクラスタリング手法がこれまでに提案されていますが、有名なところではK-means法などが挙げられます。ここでは詳細については触れませんが、クラスタリングについてより詳しく知りたい方は以下の

    軽量データクラスタリングツールbayon - mixi engineer blog
  • 1