SVM-LightをMatlab/Octaveで使うためのインターフェイスを書いた. 正直言って,データ行列とクラスラベルをファイルとして保存するため,HDDの読み書きがあるので実行が遅くなるかもしれませんが,晒しておきます. SVM-Lightのインストール とりあえずソースからコンパイルします. コンパイル済みのバイナリを使いたい人はそれでも良いです. 以下コンパイルしたい人向け. SVM-Light Support Vector Machineよりsvm-light.tar.gzをダウンロード. コンパイルします. $ cd {Your downloaded directory} $ mkdir svm_light $ mv svm_light.tar.gz svm_light/. $ gunzip -c svm_light.tar.gz | tar xvf - $ cd svm_l
SVMlight Support Vector Machine Author: Thorsten Joachims <thorsten@joachims.org> Cornell University Department of Computer Science Developed at: University of Dortmund, Informatik, AI-Unit Collaborative Research Center on 'Complexity Reduction in Multivariate Data' (SFB475) Version: 6.02 Date: 14.08.2008 Overview SVMlight is an implementation of Support Vector Machines (SVMs) in C. The main featu
前までRを使っていたのですが、せっかくPythonを使っているのだから全部移行したいなーと思って色々勉強してます。 numpyでcsvを読み込む numpy.genfromtxt関数、numpy.loadtxt関数を使えば簡単に読み込めるみたいです。 import numpy as np data = np.genfromtxt('data.csv', delimiter=',') scikit-learnでsvmlight(libsvm)形式のファイルを読み込む load_svmlight_file関数を使えば良いみたいです 8.4.1.18. sklearn.datasets.load_svmlight_file — scikit-learn 0.14-git documentation 以下の例のように同時に複数読み込む場合にはload_svmlight_files関数(最後にsが付
前回の記事で考えたシェル・スクリプトをベースにして,SVM-light 用のデータ・ファイルを作成するシェル・スクリプトを考えてみました. SVM-light のデータ・ファイルのフォーマットは, ラベル 属性番号:値 属性値番号:値 ... というものです. 属性番号:値 の組は,値が 0 のものは省略できます. ラベルは,正事例のとき 1,負事例のとき -1 です. また,トランスダクティブ学習のためのラベルなし事例のラベルは 0 です. つまり,(0, 1, 1, 0) というベクトルで表される正事例と (1, 1, 0, 0) というベクトルで表される負事例は 1 2:1 3:1 -1 1:1 2:1 と表されます. SVM を用いてテキスト分類を行うためには,テキスト(文書)をベクトル・データで表現する必要があります. やりかたはいくつかありますが,ここでは,特徴語のプレゼンス(
svm_lightの使用 参考ページ http://www.kazamiya.net/svm/svm-light_install.html ソース http://download.joachims.org/svm_light/current/svm_light.tar.gz コンパイル 501 mkdir svm-light 502 cd svm-light 500 wget http://download.joachims.org/svm_light/current/svm_light.tar.gz 509 gzip -d svm_lig* 513 tar -xvf svm_light.tar 516 make 使い方: http://www.eml.ele.cst.nihon-u.ac.jp/~momma/wiki/wiki.cgi/SupportVectorMachine/SVMli
SVMlightには、svm_learnとsvm_classifyがある。 svm_learnは学習用で、トレーニングデータを使う。 svm_classifyは、svm_learnで作った学習器でテストデータを分類する。 1、svm_learnの使い方 svm_learn [options] training.dat model_file training.datは、トレーニングデータ。用意しておく。 model_fileは、出力ファイル。これを使って、後で、svm_classifyを行う。 2、トレーニングデータの形式 一般的には、下のような形式。 ---------------------------------------------------- <line> .=. <target> <feature>:<value> <feature>:<value> ... <feature
表1:分類(教師あり)とクラスタリング(教師なし)の違い(再掲) みなさんは、中高時代に部活やってましたか。普通の教師が顧問をやったりするので、きちんとした指導もなくやみくもにトレーニングしていることが多かったように思います。そして、大人になってもゴルフでおんなじ非効率的な学習を繰り返していたりします(^^;)。これ、本当はコーチがちょっとポイントをアドバイスしてくれるだけで、ぐーんとトレーニング効率が高まるんですよね。 半教師あり学習(Semi-Supervised Learning)は、この原理と同じです。少量の教師データ(ラベル付きデータ)を用いることで、大量のラベル無しデータを活かすことができ、より簡単に学習させることができるモデルなのです(図1)。人間だってちっちゃいころに、「これは猫さん」「これはワンワンよ」と何回か教えてもらっただけで、後は自分でたくさんの猫や犬を見て自己学習
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く