タグ

2014年3月12日のブックマーク (2件)

  • mecabの辞書に新しい単語を登録する方法

    mecabの辞書に新しい単語を登録する方法のメモ。 mecabのインストール mecabをインストールすると、mecabコマンドが使えるようになります。 wgetするファイルは2013年4月時点で最新です。 yum install -y gcc-c++ cd /usr/local/src wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz tar zxfv mecab-0.996.tar.gz cd mecab-0.996/ ./configure make make check make install mecab -v

  • MeCab: 単語の追加方法

    概要 辞書への単語追加には, 二つの方法があります. システム辞書への追加 ユーザ辞書への追加 システム辞書への追加 辞書更新が頻繁でないときや, 解析速度を落としたくない時は, 直接 システム辞書を変更するのがよいでしょう. mecab-ipadic があるディレクトリに移動 foo.csv というファイルを作成 (拡張子が .csv なら何でも可) foo.csv に単語を追加 辞書の再コンパイル + インストール % /usr/local/libexec/mecab/mecab-dict-index -f euc-jp -t euc-jp % su # make install -f charset: CSVの文字コード -t charset: バイナリ辞書の文字コード 例: utf-8の辞書を作成する例 % /usr/local/libexec/mecab/mecab-dict-