タグ

clusteringに関するkei-sのブックマーク (8)

  • ちゃんと分類すれば推薦は不要:ナレッジ!?情報共有・・・永遠の課題への挑戦:オルタナティブ・ブログ

    今朝の日経新聞に推薦エンジンの記事が載っていた。記事によると推薦エンジンの分野では、日のベンチャーが米国の大手に互して競っているそうだ。推薦エンジン(レコメンデーションエンジン)市場は、数年前に立ち上がってからなかなか拡大していなかったが、いよいよ盛り上がるのかもしれない。 で、ふとひとつきほど前にTwitterで情報推薦を研究している方と議論したときに聞いた話を思い出した。 情報推薦のニーズの一つである「予想していないものに出会いたい」というニーズは、実はランダムに出すだけでもある程度実現できる このときは議論の前段階で、「検索するとき」「RSSリーダーを読むとき」「推薦されたものを見に行くとき」「参考資料を見るとき」でニーズが違うのではないかという意見がだされた。そして「推薦されたものを見に行くとき」には「予想していないものに出会いたい」というニーズがあるのではないかという話になって

    ちゃんと分類すれば推薦は不要:ナレッジ!?情報共有・・・永遠の課題への挑戦:オルタナティブ・ブログ
  • 階層的クラスタリングアルゴリズム

    次に、より一般的な多次元のデータのクラスタリングアルゴリズムについて考察する。 多次元データのクラスタリングアルゴリズムは、似たもの同士を併合していくつかの グループにまとめて行く階層的なクラスタリング (hierarchical clustering method) と、似たものが結果的に同じグループに入るように集合を分割する非階層的クラスタ リング (non-hierarchcal clustering method) とに大別して考えることができる。 非階層的クラスタリングの代表例は、k-mean法である。k-mean法は、ある初期分割か らはじめて、ある評価基準の意味で良い分割結果が得られるように対象を分類しなお すことを繰返して、最終的な分割結果を得る。k-mean法およびその改良版はアルゴリ ズムが比較的簡単なため、多くの場面で応用されている。例えば、ベクトル量子化器 の設計

  • 日本化学会・ケモインフォマティクス部会 – Divison of Chemoinformatics, The Chemical Society of Japan

    化学会・ケモインフォマティクス部会 Divison of Chemoinformatics, The Chemical Society of Japan ケモインフォマティクス部会は日化学会の部会の一つで、化学研究への情報・計算機の活用をテーマとしたケモインフォマティクス部会と改称しました。以前は「情報化学部会」でしたが、昨今「ケモインフォマティクス」という用語が一般に使われるようになり、また、わかりやすいとのこともあり「ケモインフォマティクス部会」と改称しました。現在の部会員数は約300人で、産学官の幅広い分野にわたっています。我が国のケモインフォマティクス分野の発展、普及のために活発に活動しています。化学・化学工業あるいは他の分野で、最新の情報技術・コンピュータ技術を求められている研究者、技術者、学生の方々には、ケモインフォマティクス部会に入会され有益な知識・交流の場を積極的に利

    kei-s
    kei-s 2007/09/14
    クラスタリング,U-Matrix,主成分分析,ポテンシャル関数法
  • クラスタリング結果のtreemapによる可視化(が思い通りにならない) - koyachiの日記

    主に自分メモ。更新がないとサボってると思われがち、てのもあるけど。 クラスタリング自体は実験中にしてはうまく出来ていると思っていて、それを可視化するにあたってnewsmapで使われているtreemapアルゴリズムを使ってみているんだけどうまくばらけてくれない。Google Newsを元ネタとして使っているnewsmapの場合はあらかじめカテゴリー(クラスタ)数が決まっているので初期分割数は固定で良いが、アル厨の場合はクラスタ数が未定なのでとりあえずb-treeを作っていくと、特定期間のユニークブックマーク総数に対する重要な(alphaな)ブックマーク数は必ずしも多いとは限らないのでブックマーク数でLR決定すると思い通りの結果とならない罠に陥っている様子。 以下に地味な試験中画面を示す*1。 これかたづくまでCatalyst触っちゃいけない指令を自分に出しているからさっさとかたづけたいんだけ

    クラスタリング結果のtreemapによる可視化(が思い通りにならない) - koyachiの日記
  • Flickrが写真のクラスタリングと人気ランキングに対応 - koyachiの日記

    Flickrがタグによるクラスタリングとinterestingnessと呼ばれる人気写真ランキング機能を実装したようです。 The New New Things -FlickrBlog- interestingnessは、ある写真がどの程度お気に入りに入れられたか、その写真投稿者とコメントの関係等を考慮してランキングしてあるとのこと。ExploreからSelect monthしてカレンダー画面に遷移後、日付をクリックすると、その日のinterestingnessがみれます。確かにこれはすごい。Flickrはもともと綺麗・プロっぽい写真が多い感じでしたが、interestingnessは特にそう感じられます。まさにinterestingness。 もう一つの、僕が個人的にも気になるクラスタリングのほうもすばらしく、夏・花・自然と夏・海・休暇クラスタを比較するとかなりの精度でクラスタリングされ

    Flickrが写真のクラスタリングと人気ランキングに対応 - koyachiの日記
  • ブログやSBMのカテゴリ分けというのは他人のためにしか機能してないので、自分のためにカテゴリ(以前の何か)が作れるようなマーク手段が欲しい - 焚書官の日常 (4.4.1)

    http://i.hatena.ne.jp/idea/2361 http://list.g.hatena.ne.jp/Hebi/20050604/p1 を読んで、思うこと。 自分のメモ書きはここ。 http://fragments.g.hatena.ne.jp/mutronix/20050519#p1 自分が、何かを見て「あっ」と、思うとき、これは何かに使えるかも知れない、と思う瞬間というのがあって、これはカテゴリでは捕捉不可能だと思います。 カテゴリというフィルタを通すことで、その網の目に通るように脳内で整形してしまうというか。 カテゴリの数を増やしても、「先にカテゴリを決めている」ということには変わりないわけで、それって結局「自分が今もってる枠組みで情報を処理してる」だけなんですね。 だから「反応」になる。しかし、反応…とは、すでに自分がなんであるか知ってる人の言葉じゃないんですかね。

    ブログやSBMのカテゴリ分けというのは他人のためにしか機能してないので、自分のためにカテゴリ(以前の何か)が作れるようなマーク手段が欲しい - 焚書官の日常 (4.4.1)
  • ITmediaニュース:組織の人間関係をマップ化するプログラム、産総研が開発

    産業技術総合研究所(産総研)は2月9日、組織の構造や人間関係をマップで把握できるプログラムを開発したと発表した。「コンプレックスネットワーク理論」を活用したプログラムで、実際に産総研に適用し、研究者の共著関係をネットワーク化して解析した。一般企業の組織構造の把握にも利用できるようにする計画だ。 同理論は、ノードの塊(クラスタ)が存在すると考える「スモールワールドネットワーク理論」と、リンクを多数持つハブノードと、ほとんど持たないノードがあるとする「スケールフリーネットワーク理論」両方の特徴を持つ。ノード同士のリンクがランダムに存在すると仮定する「ランダムネットワーク理論」と違い、組織の人間関係など大規模で複雑なネットワークの特徴をとらえやすいという。 産総研は、各研究者の研究タイトルや内容、共同研究者、発表日などを登録したデータベースから、論文と著者を線でつなぎ、共著者同士も線でつないで共

    ITmediaニュース:組織の人間関係をマップ化するプログラム、産総研が開発
  • RSS clustering

    id:kawasakiさんの日記「Google Newsが自分で作れる?」でも取り上げられてますが、O'Reilly Radarで知った英語圏でのRSS Clustering実装例。 rssclustering 一般的なBlog,SBM等が生成するRSSにクラスタリングが適用できないかと思って、クラスタリングについて5月くらいから調査していたので、個人的にちょうどいいタイミングの記事。 簡単にまとめると、 集約期間を変更可能にするため、RSSフィードから取得したデータはDBに保存 句読点、stop word(i,you,and,to,world,national,a等)の削除 単語を基形にする(fires,fired,fireは同じものとして扱う) 集約結果表示時は一つの情報ソースを複数のクラスタに重複表示しない(これは重複表示したほうがよい場合もあるかもしれないけど、データ量が多くなる

    RSS clustering
  • 1