タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Solrと形態素解析に関するeibiisii_mikanのブックマーク (1)

  • 2010-05-27

    Solr(というかLucene)で日語を使えるようにするには 大きくわけて、N-グラム(CJKAnalyzer)か形態素解析(JapaneseAnalyzer) を使う方法がある。 N-グラムは東京都で検索すると京都が引っかかったりと残念なので、 形態素解析を使いたいのだが、Lucene-jaでは形態素解析にsenを使わなきゃいけない。 senはバギーなので(辞書に登録する単語数が少ない場合は問題ない) Lucene-jaを改変してGoSen(senよりかはマシ)用のラッパーを作らなきゃいけない。 antを入れておきましょう(eclipseなら標準ではいってる) ダウンロード http://itadaki.svn.sourceforge.net/viewvc/itadaki/GoSen/ より落とす。SVNがない場合はしたのほうでtar.gz形式でダウンロードできる $GoSen_HOM

    2010-05-27
  • 1