タグ

clusterに関するy_yanbeのブックマーク (4)

  • twitter's social network analysis

    The document discusses analyzing the community structure of a Twitter social network with 329 users and 75 topics. It proposes using the favorite function and weighted reciprocal of favorites between users to cluster the network into communities. It describes implementing the analysis in R using the igraph package and discusses that calculating communities for the whole network of 5000 users would

    twitter's social network analysis
  • クラスタリング (クラスター分析) - Toshihiro Kamishima

    クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

    クラスタリング (クラスター分析) - Toshihiro Kamishima
  • Open source Clustering software

    The open source clustering software available here contains clustering routines that can be used to analyze gene expression data. Routines for hierarchical (pairwise simple, complete, average, and centroid linkage) clustering, k-means and k-medians clustering, and 2D self-organizing maps are included. The routines are available in the form of a C clustering library, an extension module to Py

  • RSS clustering

    id:kawasakiさんの日記「Google Newsが自分で作れる?」でも取り上げられてますが、O'Reilly Radarで知った英語圏でのRSS Clustering実装例。 rssclustering 一般的なBlog,SBM等が生成するRSSにクラスタリングが適用できないかと思って、クラスタリングについて5月くらいから調査していたので、個人的にちょうどいいタイミングの記事。 簡単にまとめると、 集約期間を変更可能にするため、RSSフィードから取得したデータはDBに保存 句読点、stop word(i,you,and,to,world,national,a等)の削除 単語を基形にする(fires,fired,fireは同じものとして扱う) 集約結果表示時は一つの情報ソースを複数のクラスタに重複表示しない(これは重複表示したほうがよい場合もあるかもしれないけど、データ量が多くなる

    RSS clustering
  • 1