タグ

ブックマーク / www.kde.cs.tut.ac.jp/~atsushi (1)

  • R で多様体学習の Isomap を実装する | Atsushi TATSUMA Web Page

    はじめに 突然ですが、僕は、次元削減厨です。 高専の時に主成分分析・独立成分分析に出会ってから、次元を削減し続けてきました。 ウソです。途中、検索の特徴量の研究やったり、会社はいって Web サービス作ったりしてました。 それはさておき、多様体学習という学習アルゴリズムの枠組みがあります。 全体としては変な形でも局所的に見ればユークリッド空間という、多様体の性質を利用してます。 その多様体学習に Isomap という非線形次元削減手法があります。 難しそうですが、なんてことはない、多次元尺度構成法の距離に測地線距離を使ったものです。 測地線距離は、ユークリッド距離のような直線的なものではなく、道に沿ったものです。 Isomap では、データ点間をつないだグラフ上での、最短経路で近似します。 k近傍グラフの作成 測地線距離の計算の前に、データ点間をつないだグラフを作成します。

    rishida
    rishida 2012/11/29
    ISOMAP。測地線(曲がった直線)で距離を定義し、MDS(多次元尺度構成法)で主成分方向を求めて射影する手法
  • 1