タグ

termextractに関するkomagataのブックマーク (2)

  • NAL研卒業研究ノートnote_show

    今週やってくることの一つとして、学習データを作成して実際にSVMで学習させてみる、というのがある。 そのためのソフトウェアとしてMeCabを利用する。 また、TermExtract という単語(名詞)に対する重み付けを行うためのPerlモジュールを利用する。 MeCabは形態素解析を行うソフトウェア。 TermExtractはMeCabやChaSenなどの処理結果から語句の重要度(TF・IDFなど)を計算する。 まずはMeCabのインストール ソースの入手先:http://mecab.sourceforge.net/src % ./configure --with-charset=utf8 % make % su # make install MeCab用の辞書も同様の手順でインストール 今回はIPA辞書を使うことにする ソースの入手先:http://mecab.sourceforge.

  • TermExtractを使ってキーワード抽出 - TechMemo

    TermExtractを使ってキーワード抽出 トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン カテゴリ[Perl] TermExtractのMecabモジュールでキーワード抽出を行う。 まずはMecabのテキストを作る。 use MeCab; my $text = "私はももが好きです。"; my $mtext = getMecabText($text); sub getMecabText{ my ($text) = shift @_; my @arg = ($0,"Ochasen"); my $mecab = new MeCab::Tagger(\@arg); my $exdata = new TermExtract::MeCab; $text = $mecab->parse($text); return $text; } うんでTemrmExtract::Mecab

    komagata
    komagata 2008/03/13
    TermExtract::MeCabのサンプル
  • 1