タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

senに関するvolonteのブックマーク (1)

  • sen UTF-8化 | mono-blog

    Javaの日語解析ライブラリ「sen」を使っています。 senのデフォルトの文字コードがEUC-JPなのですが、Javaから使用すると文字化けしたりすることがあるので、UTF-8に変更しました。 設定箇所は2箇所あります。 $SEN_HOME/dic/dictionary.properties 45行目付近 dic.charset=utf-8 // internal charset which is used in sen’s dictionary //sen.charset=EUC-JP sen.charset=utf-8 $SEN_HOME/conf/sen.xml 18行目付近 <charset>utf-8</charset> <unknown>未知語</unknown> とします。 また、$SEN_HOME/dic/dic.csvUTF-8にする必要がある

    volonte
    volonte 2010/11/12
  • 1