タグ

ブックマーク / plaza.rakuten.co.jp/kugutsushi (1)

  • MeCab 0.92 を使ってみる (1) - 傀儡師の館.Python:楽天ブログ

    2006.07.15 MeCab 0.92 を使ってみる (1) カテゴリ:ことばの処理 久々に MeCab を使って遊ぶことにした。最新のバージョン 0.92 をダウンロードしてインストール。その前にインストールしてあった、ちょっと古めのバージョン 0.90rc8 と比較してみる。形態素解析結果の違いを見てみると、何気にかなりの差分が出る。未知語で固有名詞に倒していたものが名詞に倒すようになったとかあるのかな。例えば、「ヒューレット・パッカード」を新しくできた -x オプションを付けて「mecab -x UNKNOWN」で解析してみると、 ヒューレット・パッカード UNKNOWN と解析される。辞書に登録されているかどうかは、辞書作成用の csv ファイルを検索しなくても、こうしてみれば簡単にチェックできるようになった。地味だが案外嬉しい。 以前のバージョンとの違いで気になるところを見て

    MeCab 0.92 を使ってみる (1) - 傀儡師の館.Python:楽天ブログ
  • 1