タグ

ブックマーク / sile.hatenablog.jp (1)

  • Sanmoku: 省メモリな形態素解析器 - sileのブログ

    GomokuをベースにしたSanmokuという形態素解析器を実装した。 Gomokuに比べて解析時に必要なメモリ量が少ないのと初期ロード時間が短いのが特徴。 将来的には解析精度を若干落として、辞書サイズ*1をさらに削減する可能性もあるけど、現状は解析結果はGomoku互換。 Android等のリソースの制限が厳しい環境での使用を想定。 最低メモリ所要量とロード時間 以下、自分の環境*2での計測結果。 ## 最低メモリ所要量 # Gomoku(0.0.4)は 26MBのメモリが必要 $ java -Xmx26m -cp gomoku-0.0.4.jar net.reduls.gomoku.bin.Gomoku < /path/to/natsume-soseki.txt > /dev/null # Sanmoku(0.0.1)は 11MBのメモリが必要 $ java -Xmx11m -cp s

    Sanmoku: 省メモリな形態素解析器 - sileのブログ
    kw5
    kw5 2013/04/18
  • 1