alfaladioのブックマーク / 2008年12月10日 - はてなブックマーク

alfaladio id:alfaladio

2008年12月10日のブックマーク (3件)

MeCabの品詞ID(pos-id)を使う - のほほん徒然
第二十三回文書をMeCabを使って形態素解析していたが，名詞だけを抜き出したいとか，固有名詞だけが必要というときに，今までは品詞情報から正規表現でマッチさせて場合分けしていた．これがやっぱり処理としては遅いようだ．そこで，品詞情報から正規表現を使って場合分けするのではなく，MeCab-0.92から利用できるようになった品詞IDを利用してマッチさせてみる．このエントリはその時ちょっとハマったのでメモ． http://mecab.sourceforge.jp/posid.htmlのページでも説明されているが，品詞IDを定義したファイル(pos-id.def)を変更した場合，辞書の再コンパイルが必要だ．ここでハマった．自分が成功した時の情報をメモ．環境はMeCab-0.93(MeCab本体と辞書の両方をutf8で利用)．自分で品詞情報とか，未知語の定義とかを追加したりはしてないので以下の
alfaladio 2008/12/10
リンク
LiveCoding行ってきましたよ & MeCabメモ - もち
何とも言えん不思議な雰囲気で楽しかった．京大町家キャンパスもサイコー．うじひささん，お疲れさまでした． MeCab LiveCodingのなかでMeCabがチラッと出てきたので，その場でチャチャっとMacにインストールしてみました． $ sudo port install mecab +utf8 # これでutf-8もバッチリ？+sjisでShift-JISの辞書ファイルも $ sudo port install rb-mecab これで，RubyからMeCabを呼ぶことができます．素敵ですね！PerlやPython用のも用意されてるみたいです．続きで，MeCabを試してみます． MeCabの大まかな使い方 require 'MeCab' str = "形態素解析をしちゃいます．" # ChaSen互換の出力をする chasen = MeCab::Tagger.new("-Ochasen
alfaladio 2008/12/10
自然言語処理

mecab

ruby

search
リンク
創り出すためのアウトライン・プロセッサ『カケラの樹』
alfaladio 2008/12/10
リンク
- 2008年12月11日
- 2008年12月10日
- 2008年12月9日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx