タグ

2011年4月10日のブックマーク (2件)

  • [Solr] GoSenを使う

    Java形態素解析ライブラリはもうSenしかない状況、、だと思っていましたが、(ちょっと途中で投げ出されている感はあるものの)GoSenのほうが辞書作成もJavaだけでできる等、整備されていて良さそうです。 ただ、Senはトークナイザだけを提供しているので、Solrで使うにはLucene-jaというのを別途取ってきて、そこに入っている"アナライザ"経由で使わなくてはなりません。 つまり、(Lucene-jaの)アナライザが使うトークナイザを、SenからGoSenに変えればよい。。のですが、GoSenはSenから多少構成が変わっているため「ただjarを入れ替え」るだけでは動きません。 細かくはまた別に書こうと思いますが、hideakiさんのブログを参考に、 ・Lucene-ja(のSenTokenizer.javaを)書き換え ・無いと不便なbuild.xmlを作成 としたlucene-j

  • my code stock.com

    Save and manage At my code stock.com you can save and organize all your snippets or even complete scripts for your work. Keep track of even huge collections by using folders, tags and the powerful search functionality. Powerful editor Edit your snippets by using the powerful editor which provides syntax highlighting for more than 30 programming and scripting languages, autocompletion, highlighting

    my code stock.com