タグ

mecabに関するzyusouのブックマーク (2)

  • Ubuntu14.04とPython3でMeCabを使う方法 | トライフィールズ

    MeCabは各種スクリプト言語(perlrubypythonJava)から、各言語バイディングで利用できるようになっている。 しかし、Pythonで用意されているのはPython2系のもので、残念ながらPython3系では使えない。 そこで、ここでは用意されているPython2系バイディングをPython3系に変換して使用する方法をお伝えする。 MeCabのインストール まずは、MeCabをインストールするため、次のコマンドを実行する。 辞書はIPA(utf-8)を選択した。 $ sudo apt-get install mecab mecab-ipadic-utf8 インストールが完了したら、MeCabのバージョンを確認しておく。 $ mecab -v mecab of 0.996 swigとlibmecab-devのインストール MeCabが用意している各言語バイディングはSWI

  • windows版mecabにutf-8のシステム辞書を追加する

    windows版mecabにシステム辞書を追加する。(unix版はこちら) unicodeの文字も扱いたいので、辞書の文字コードはutf-8とする。 環境: windows 7 (64bit) windows版のmecab(辞書の文字コードutf-8)が既にインストールされていることが前提。 1.utf-8で書かれた辞書を用意する こちらのページの1~3を参考 2.インストール済みmecabの辞書をutf-8に保存し直す windowsにインストールされたmecabの辞書データはsjisで保存されている(インストール時にutf-8を選んだとしても)。拡張子がCSVとdefのファイルが辞書データなのですべてutf-8に保存し直す。(ディレクトリ全体に対してutf-8変換してもいい) ←ダメだった 辞書CSVファイルのパス ——————————————— C:\Program Files (x

    windows版mecabにutf-8のシステム辞書を追加する
  • 1