タグ

ブックマーク / fg-180.katamayu.net (2)

  • 83's : MeCabの辞書作成補助

    形態素解析器MeCabの 辞書を自分で作る場合、動詞や形容詞など活用する品詞については 自分で活用を書かなければいけないんですが、 激しく面倒なのでこれを自動化するやつを作ってみた。 ( ・∀・)つ[katsuyou.tar.gz] このプログラムを使うには、別途ローマ字ひらがな変換ライブラリ suikyoと、 茶筌に(多分)付属しているcforms.chaが必要です。 まー基的にはcforms.chaでなくても、同じフォーマットで、かつ活用形の中に「基形」が 入っていれば動くはずです。 あとRubyも必須です。 katsuyou.rbは、入力されたMeCabの辞書の中で活用できるものがあるとそれを活用展開します。 だからあらかじめ1つだけ書いておきます。 ちなみにフォーマットはこう。 表層形,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用型,活用形,原形,読み,発音 例

  • 83's : JumanのRubyバインディング

    Jumanの RubyバインディングRuby-Jumanを作ってみたよ。 (; ・∀・)つ[rubyjuman_wrap.c] サッ SWIGでやったので、そのファイルもうpしときますね。これ使えばPerlとかもいけるんではないかと。 ホントカヨ…(; ・∀・)つ[rubyjuman.i] コソーリ $ tar zxvf juman-5.1.tar.gz $ cp rubyjuman_wrap.c juman-5.1/lib $ cd juman-5.1 $ ./configure $ make (# make install ←Jumanがインストールされていない場合) $ cd lib $ gcc -c -fPIC -I/usr/lib/ruby/1.8/i386-linux rubyjuman_wrap.c $ gcc -shared *.o -o Juman.so -Iのところは人

  • 1