[B! algorithm] Matthewのブックマーク

Matthew id:Matthew

algorithmに関するMatthewのブックマーク (2)

K-means法によるクラスタリングのスマートな初期値選択を行うK-means++ - kaisehのブログ
K-means法は、入力データからK個のランダムな個体を初期クラスタの中心として選択し、以降、クラスタの重心を移動させるステップを繰り返すことでクラスタリングを行う非階層的手法です。K-means法はシンプルで高速ですが、初期値依存が大きいのが弱点で、不適切な初期値選択をすると間違った解に収束してしまいます。以下は、Introduction to Information Retrievalの16章に出てくる例です。 {d1, d2, ..., d6}をK=2でクラスタリングする場合、{{d1, d2, d4, d5}, {d3, d6}}が大域最適解ですが、初期クラスタの中心をd2, d5で与えると、{{d1, d2, d3}, {d4, d5, d6}}という誤った解に収束してしまいます。この問題を改善するK-means++という手法を見つけたので、試してみました。 K-means+
Matthew 2009/01/14
algorithm
リンク
最小完全ハッシュ関数の作り方
■順列型の最小完全ハッシュ関数０から４までの５個の数字が下のように並んでいる場合を例にして説明します。５個の数字の並べ方は５！通りありますので５！(=120)通りの並べ方の総てに対して0から119までの数値を一意に割り付けることが目的となります。３４１０２ここでは左側から順に数字を見ていくことにします。最初の数字は３で残りの数字の個数は４個ですね。この残れさた数字の個数分の総順列数は４！ですが、この数量を基数と言います。つまり左端の数字が何であるかを完全に識別する為に最低限必要な基本となる重みのことです。従って先ず最初の数字３に基数である４！を掛け算してはじき出します。 [３]４１０２　→　３＊４！次に左から２番目の数字ですが、ここから先はとても注意が必要です。２番目の数字は４で残りの数字の個数は３個です。残りの数字の個数が３個なので基数は３！になります。つまり基数が変化
Matthew 2007/04/19
algorithm

ハッシュ値

ハッシュ関数
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx