タグ

svmに関するteppeisのブックマーク (6)

  • SVM実践ガイド (A Practical Guide to Support Vector Classification)

    SVM実践ガイド (A Practical Guide to Support Vector Classification)

    SVM実践ガイド (A Practical Guide to Support Vector Classification)
    teppeis
    teppeis 2014/01/06
  • LIBSVMの特徴量の重みを見る - LIBSVMのモデルの読み方 - 唯物是真 @Scaled_Wurm

    以前LIBSVMで特徴量の重みを見る方法について記事でURLを紹介したのですが、リンク先の記事とコードがなくなっているみたいなので、改めて記事にしておきます。 SVMでの特徴量の重み 非常に単純化して説明すると、線形カーネルのSVMは次のような式の符号の正負によってデータを分類します。 このときがデータのベクトルで、が学習された重み、が学習されたバイアス項になっています。 重みの絶対値が大きな特徴量は識別に大きな影響を与える≒重要な特徴量であると考えることができ、学習結果の分析などで使われています LIBSVMのモデルの読み方 まず以下の二値分類の例でLIBSVMのモデルファイルの説明をします svm_type c_svc kernel_type rbf gamma 0.000361402 nr_class 2 total_sv 707 rho -1.00298 label -1 1 nr

    teppeis
    teppeis 2013/07/29
  • 線形識別器でカーネルトリックを使う方法 - Preferred Networks Research & Development

    WEB+DB PRESS Vol.64に「作って学ぶ日本語入力」という特集記事を書かせていただきました。徳永です。全国の書店で発売中ですので、ぜひみなさんお買い求めください。(宣伝) さて今回は、線形識別器でカーネルを使うのと同じ効果を得るための手法を紹介したいと思います。 カーネルとは SVMはカーネルトリックによって非線形識別を可能としたことによって、研究コミュニティで大流行しました。 カーネルトリックは線形空間では線形分離できないデータを高次元空間に写像してそっちで線形分離しちゃおう、でも高次元に実際に写像してしまうと計算量が増えちゃうから、問題を等価な形に変形して高次元に写像した場合と同じ結果を高速に計算しようね、というテクニックです。具体的には、高次元データが出てくる部分は全部内積で書ける形に変形し、この内積の部分をカーネルと呼ばれる特殊な関数で置き換えます。 結局、自然言語処理

    線形識別器でカーネルトリックを使う方法 - Preferred Networks Research & Development
  • SVMツールと関連する論文まとめ - EchizenBlog-Zwei

    最近SVM(Support Vector Machine)周りの復習をしているので有名どころのツールと、それに関連する論文をまとめた。完全に個人用メモなので抜けがあるかも。あくまで参考程度に。 ツールは色々あるけれど使うのが目的なら定番のsvmlightやlibsvmがいい気がする。最近だとliblinearが流行っている。SVMといえばカーネル関数とマージン最大化だけれど、最近ではカーネルは線形でいいやという流れになってきている?個人的にはpegasosがわかり易い線形カーネル+オンライン学習になっていて自分で作って遊ぶには良いと思っている。またsvmsgdは"straightforward stochastic gradient descent"と言っているものの非常に高性能で、それを実現するための様々な工夫が施されていて実装を学ぶ上で大変参考になる。ここには挙げていないけれど、線形カ

    SVMツールと関連する論文まとめ - EchizenBlog-Zwei
    teppeis
    teppeis 2011/08/31
  • SVMの定番入門書「サポートベクターマシン入門(赤本)」の読み方 - EchizenBlog-Zwei

    SVMを学びたい人にとっては「サポートベクターマシン入門」通称「赤」は最適な入門書であるといえる。理論から実践までバランスよく解説されており、書を読むだけでSVMの実装が可能になる。 しかし書はSF小説を彷彿とさせる独特な翻訳の文体のため機械学習に不慣れな読者にとっては読みこなすのは苦しい戦いとなる。来なら原書をオススメしたいところだが、そうはいっても英語はちょっとという人も多いはず。 そこで記事では赤のオススメな読み方を紹介してみる。 1.「わかパタ」で準備運動をしよう 泳ぎのうまい人でもいきなり水に飛び込むのは危険。まずは準備運動をして体を温める。これには「わかりやすいパターン認識」がオススメ。とりあえず2章まで、余裕があれば3章まで読んでおけば充分。 2.赤を枕元において一晩寝よう さて準備運動が済んだら早速赤にトライ!したいところだが赤の放つ瘴気で心を蝕まれないよ

    SVMの定番入門書「サポートベクターマシン入門(赤本)」の読み方 - EchizenBlog-Zwei
    teppeis
    teppeis 2011/08/31
  • SVMを用いたチャンキングツールYamChaを使ってみた - nokunoの日記

    SVMを用いたチャンキングツールのYamChaを使ってみました.YamCha: Yet Another Multipurpose CHunk Annotator実験データとして,CoNLL2000のSharedTaskを使いました.ChunkingYamchaのインストールはTinySVMに依存してたりするのですが,id:hjym_uさんが登録しMacPortsがあったので使ってみました.自然言語処理・機械学習ツールのMacPortsを登録 - 自然言語処理 on Macsudo port install yamchacp /opt/local/libexec/yamcha/Makefile .make CORPUS=train.txt MODEL=chunking trainyamcha -m chunking.model result.txt実行結果head result.txtRoc

    teppeis
    teppeis 2011/07/25
    macportsでTinySVMはいるらしい。
  • 1