キレイな商品説明を簡単に作成できる「オークションプレートメーカー」 ヤフオクのフォームにワンクリックで記入できる「出品ぽちぽち」「取引ぱたぱた」 全て無料!インストール不要!
キレイな商品説明を簡単に作成できる「オークションプレートメーカー」 ヤフオクのフォームにワンクリックで記入できる「出品ぽちぽち」「取引ぱたぱた」 全て無料!インストール不要!
クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基本的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.
Ward法(ウォードほう、英: Ward's method)は、クラスター分析の時に使用される、クラスター間の距離を定義する距離関数のひとつ。 今、集合PとQがあるとき、Ward法では、 d(P,Q) = E(P ∪ Q) - E(P) - E(Q) で定義されるd(P,Q)を、PとQの距離とする。 ただし、E(A)は、Aのすべての点からAの質量中心までの距離の二乗の総和。 特徴[編集] ウォード法は、クラスタの各値からその質量中心までの距離を最小化する。そのため、一般に、他の距離関数に比べて分類感度が高いといわれる。
えぬぐらむ n-gram n-gram は連続するn個の要素のことを指す。何の要素かによって「文字n-gram」「単語n-gram」などと呼ぶ。よって n-gram という呼び方で何かの数字を表すものではないので、「この場合の n-gram はいくつ?」みたいな質問はナンセンスである。また、重さを表す単位とは何の関係もない。 n-gram の種類 前述したように n-gram とは単なる「要素連続」しか意味しないので、「何の要素を」「どれくらい」対象にするかによって振る舞いは大きく異なる。よって、n-gram がいいか悪いかと言った抽象的な議論は多くの場合意味がない。 要素とするもの 文字、単語が多く、おそらく単語を使うことが最も多い。この他に、途中の付属語(機能語)を無視して自立語(内容語)だけのn-gram、その逆に機能語のn-gramを考えることもある。さらに、問題によっては品詞
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く