タグ

ブックマーク / xn--p8ja5bwe1i.jp (1)

  • SVM-light 用データ・ファイルを作成するシェル・スクリプト | とうごろぐ

    前回の記事で考えたシェル・スクリプトをベースにして,SVM-light 用のデータ・ファイルを作成するシェル・スクリプトを考えてみました. SVM-light のデータ・ファイルのフォーマットは, ラベル 属性番号:値 属性値番号:値 ... というものです. 属性番号:値 の組は,値が 0 のものは省略できます. ラベルは,正事例のとき 1,負事例のとき -1 です. また,トランスダクティブ学習のためのラベルなし事例のラベルは 0 です. つまり,(0, 1, 1, 0) というベクトルで表される正事例と (1, 1, 0, 0) というベクトルで表される負事例は 1 2:1 3:1 -1 1:1 2:1 と表されます. SVM を用いてテキスト分類を行うためには,テキスト(文書)をベクトル・データで表現する必要があります. やりかたはいくつかありますが,ここでは,特徴語のプレゼンス(

  • 1