タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

特徴抽出に関するsovapritzのブックマーク (2)

  • 特徴選択 - 機械学習の「朱鷺の杜Wiki」

    特徴選択 (feature selection)† \(k\)個の特徴量(属性)のベクトルで記述されている対象に機械学習の手法を適用するとする.\(k\)個の特徴量を全て利用せず,その中で有用なものを選び出すのが特徴選択.その目的は次の二つ: 目的変数と無関係な特徴量を使わないことで予測精度を向上させる. 学習された関数を,定性的に解釈しやすくする. その実現手法は次の二つに分けられる: フィルター法:目的変数と各特徴量との情報ゲインなどの,特徴の良さの規準を使って選択する. ラッパー法:特徴量の部分集合を使って実際に学習アルゴリズムを適用し,交差確認法などで求めた汎化誤差を最小にする特徴量の部分集合を選択する. 学習アルゴリズムを適用する必要があるラッパー法の方が予測精度は向上するが,フィルター法の方がはるかに高速. 特徴量が\(k\)個あるとき,全部で \(2^k-1\)個の特徴量の部

  • 醜いアヒルの子の定理 - 機械学習の「朱鷺の杜Wiki」

    醜いアヒルの子の定理 (ugly duckling theorem)† 醜いアヒルの子を含む \(n\)匹のアヒルがいるとする. このとき,醜いアヒルの子と普通のアヒルの子の類似性は,任意の二匹の普通のアヒルの子の間の類似性と同じになるという定理. \(n\)匹のアヒルの子を区別するために,\(K=\log(n)\)個の二値の特徴量を使う. これらの特徴量を使ってできるルールは,各アヒルについて含む・含まないが独立にありうるが,どのアヒルも含まないルールは除外するので,全部で \(N=2^n-1\)個存在. これら \(N\)個のルールのうち,醜いアヒルの子とある普通のアヒルの子のどちらも含むようなルールは \(2^{n-2}\)個. 一方,任意の二匹の普通のアヒルの子を同時に含むルールはやはり \(2^{n-2}\)個. 二匹のアヒルの類似性を,これらを共通に真にするルールの数で評価する

  • 1