タグ

Igoに関するat_yasuのブックマーク (3)

  • Igo-pythonをGAEでも動かす。 - Keep on moving

    あいかわらずIgoをいじって遊ばせていただいています。 Igoを使っていて感じたことをかるくまとめておきます。 Igoの辞書変換時の注意点 IgoではMecab形式のファイルをいったんIgoを使って変換する必要がある。 ドキュメントには書いてないけど以下の場合には辞書の変換に失敗する。 はまったのでメモ的にまとめておきます。 辞書に"(ダブルクォート)を含む場合、変換parserのエラーになる。(今回は取り除くことで可能) Mecabの辞書内で出現頻度をスコアで指定するんだけど、Igo側はここをIntegerで解釈しているので,Integerの範囲を超えた値にすると変換エラーになる。 辞書の変換には思った以上にメモリをいます。具体的にはスタックオーバーフローエラーがおこります。辞書のファイルサイズが大きい場合にはスタック領域をなるべく増やして実行しましょう。例えば、NAIST Japan

    Igo-pythonをGAEでも動かす。 - Keep on moving
  • 形態素解析器IgoのPython版作った

    いろんなメモです。おもにプログラミング関係。 a memorandum. most of all contents are related to programming. Java(とCL)で書かれた形態素解析器であるIgoPythonにほぼそのまま移植しました。 Java版で作った辞書がそのまま使えるようにしたので、辞書を作る部分は(まだ)移植してません。 mmapしてるのでGAEでは動きません。すぐ取りかかる予定です。 またGAE版の辞書はBigEndianなのでそこらへんも対応する予定です。 https://code.launchpad.net/~hideaki-t/+junk/igo-pyに置きました。 簡単なテストしかしてません。問題があったら教えてください! 簡単なサンプル # coding: utf-8 import igo.Tagger t = igo.Tagger.Ta

    形態素解析器IgoのPython版作った
  • Igo-pythonの導入メモ

    Igoのサイトの手順そのままです。 準備 igo-0.4.2.jarの入手 辞書のダウンロードと展開 $ java -cp igo-0.4.2.jar net.reduls.igo.bin.BuildDic コンパイル済み辞書出力先 ダウンロードした辞書を展開したところ 辞書の文字セット$ java -cp igo-0.4.2.jar net.reduls.igo.bin.BuildDic ipadic mecab-ipadic-2.7.0-20070801 EUC-JP

    Igo-pythonの導入メモ
  • 1