タグ

辞書に関するt_takataのブックマーク (2)

  • Java,Senでnaist-dicを使う - <s>gnarl,</s>技術メモ”’<marquee><textarea>¥

    用意するもの mecab用naist-dic sen naist-dicのnaist-jdic.csvをsenのdicディレクトリに入れとく(EUC-JPなので文字コード変換が必要ならしとく)。 デフォルトのdic.csvじゃなくこっちを利用するようにするためbuild.xml修正。 < !-- Comment out if you would like to add your custom dictionary. Custom dictionary format have to compatibule with 'dic.csv'. This parameter is a file path for custom dictionary. You can add multiple dictionary here like "custom_dic1.csv custom_dic2.csv..

    Java,Senでnaist-dicを使う - &lt;s&gt;gnarl,&lt;/s&gt;技術メモ”’&lt;marquee&gt;&lt;textarea&gt;¥
  • ChaSen's Wiki - 辞書の作り方

    茶筌の辞書をつくるためには以下のファイルが必要です。 辞書定義ファイル *.dic 文法定義ファイル grammar.cha - 品詞定義ファイル ctypes.cha - 活用型定義ファイル cforms.cha - 活用形定義ファイル connect.cha - 連接表定義ファイル 一般に、ユーザーが変更を加えるのは辞書定義ファイルのみです。 辞書のコンパイルには makeda コマンドを使います。 この作業は文法定義ファイルのあるディレクトリでおこなう必要があります。 $ makeda dic_name input1.dic input2.dic dic_name には出力したい辞書ファイルのベースネーム(拡張子を除いたファイル名)を指定します。たとえば、user を指定すると、user.da、user.lex、user.dat が生成されます。 入力の辞書定義ファイルは複数指定でき

  • 1