タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

データマイニングに関するxmmmのブックマーク (5)

  • 統計ソフトRのブログ 共起性尺度

    共起尺度について説明します。 共起とは、まさに ある一組の「共に起きる」程度を表したものです。 例えば、 amazonを検索するときに、 この商品を買っている人は、このも買っています と紹介されますが、それは、過去の購買データから、 共起が高い商品を勧めているのです。 共起尺度として、 主なものは、 共起頻度、Jaccard係数、Simpson係数、コサイン距離があります。 これらの指標について、「X」と「Y」という一組の共起性がどう測られるか示します 「X」と「Y」の単独での出現数を|X|、|Y|、 どちらか一方が出現した回数を|X∪Y|、 両方が出現した回数を|X∩Y|とします。 A)共起頻度 共起の回数であり、 |X∩Y|で計算される。 B)Jaccard係数 どちらかが出現したうち、何回同時に出現するかで、 |X∩Y|/|X∪Y|で計算される C)Simpson係数 Jacc

  • 自己組織化マップ(Self-Organizing Maps)の基礎

    自己組織化マップ(Self-Organizing Maps)の基礎 伊藤 冬子, 廣安 知之, 三木 光範 ISDL Report  No. 20050822007 2006年 1月 8日 Abstract 自己組織化マップ(Self-Organizing Maps, SOM)はニューラルネットワークの一種である. 多次元のデータを2次元に写像することが可能であり, 高次元空間の可視化に用いることが可能である. またこれらの多次元のデータを予備知識なしでクラスタリング可能である. 報告では, 多次元データの可視化, クラスタリングを目的とし, SOMを調査した. また, 無料配布されているSOMのパッケージSOM_PAKを実際に利用した. 1  はじめに 各分野で取り扱われるデータは多次元であることが多い. また, データごとの特徴などの予備知識が ない中で, その分類や

  • 自己組織化マップ(SOM:Self Organizing Maps) − ホーム

    自己組織化マップ(SOM:Self Organizing Maps)のソースプログラムの活用方法について 説明しています。

  • 統計ソフトRのブログ 共起性尺度

    共起尺度について説明します。 共起とは、まさに ある一組の「共に起きる」程度を表したものです。 例えば、 amazonを検索するときに、 この商品を買っている人は、このも買っています と紹介されますが、それは、過去の購買データから、 共起が高い商品を勧めているのです。 共起尺度として、 主なものは、 共起頻度、Jaccard係数、Simpson係数、コサイン距離があります。 これらの指標について、「X」と「Y」という一組の共起性がどう測られるか示します 「X」と「Y」の単独での出現数を|X|、|Y|、 どちらか一方が出現した回数を|X∪Y|、 両方が出現した回数を|X∩Y|とします。 A)共起頻度 共起の回数であり、 |X∩Y|で計算される。 B)Jaccard係数 どちらかが出現したうち、何回同時に出現するかで、 |X∩Y|/|X∪Y|で計算される C)Simpson係数 Jacc

  • 類似度と距離 - CatTail Wiki*

    2つのデータが似ている度合いを,類似度の大きさや距離の近さといった数値にしてあらわすことで,クラスタ分析や,k-近傍法,多次元尺度構成法(MDS)をはじめとするいろいろな分析を行うことが可能となる. ここでは,よく知られている類似度や距離について述べる. 類似度という概念は,2つの集合の要素がまさにどれだけ似ているかを数量化したものであり,距離とは,要素同士の離れ具合,従って非類似度とちかい概念と考えてもよい. 参考までに数学における距離の概念の定義を示すと, 距離空間の定義 Sを1つの空でない集合とし,dをSで定義された2変数の実数値関数 d(SxS) → R が,以下の4条件(距離の公理) D1 : (非負性) 任意のx,y∈Sに対して d(x,y)≧0. D2 : (非退化性) x,y∈Sに対し d(x,y)=0  ⇔ x=y. D3 : (対称性) 任意のx,y∈Sに対して d(x

    類似度と距離 - CatTail Wiki*
  • 1