自己組織化マップ(SOM)は、クラスタリングの問題にも、クラス分類の問題にも利用できます。しかしながら、日本ではこの2つの分類法の違いが正確に理解されておらず、混乱することが多々あります。 英語では、「分類」に関する単語がいろいろとあります。グルーピング(grouping)、セパレーション(separetion)、オーディネーション(ordination)、ソーテーション(sortation)、セグメンテーション(segmentation)、カテゴリゼーション(categorization)、クラシフィケーション(classfication)等々。これだけの言葉があるのは、それぞれ微妙に意味(ニュアンス)が違うからであって、だてではありません。欧米人は、「分類」について、これだけ繊細な感覚を持ってます。 一方、我々日本人はというと、「分類」は分類でしかなく、きわめて素朴です。 そのためか日
SOMはニューラルネットワークの一種で 与えられた入力情報の類似度をマップ上での距離で表現するモデルです. 技術が発達した現代では複雑な情報が数多く存在します. しかしそのような高次元データを人間が瞬時に理解することは困難です. SOMは高次元データの中に存在する傾向や相関関係の発見などに応用することができ 人間が高次元データを視覚的に理解する手助けを行ってくれます. SOMの特徴を一言であげるとすれば 様々な高次元データを予備知識なし(教師なし)にクラスタリングできる点にあります. またこれが自己組織化といわれる所以です. SOMは主にデータマイニングの1手法として応用され, データの分類,視覚化,要約などを得意としています. 現在ではプロセス解析,制御,検索システム,さらには経営のための情報分析など 実社会において重要な分野へ応用されています. SOMは規則的
市販のデータマイニング本にSOMがクラスタリング手法の1つとして掲載されているのですが、あまり正確な説明がされていませんのでご注意ください。SOMと従来のクラスタ分析の違いをちゃんと説明している著者は皆無です。 もっともひどい間違いは、3×3個とか3×4個とか4×4個といったわずかなノード数のSOMを使って、(データサンプルがどのノードに対応するかだけで)クラスタリングをしている解説書があります。それは完全な誤解です。 クラスタリング問題にSOMを使うことのメリットは、SOMがデータ空間の位相的順序(トポロジー)、つまり、「つながり方」を保持できるというところにあります。 上図はデータサンプルの布置を2次元のイメージで表現したものです。実際には多次元の空間にこのようなものがあると思ってください。従来のクラスタ分析は、(A)や(B)の場合に有効ですが、(C)のような場合には有効なアルゴリズム
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く