ECナビ デベロッパー ネットワーク: NavicSearch API で利用しているTokenizer 0.5:非ラテン文字については bi-gram でTokenを切り出し:非ラテン文字の間に挟まれた「・==☆★・」 をトークン生成の際に無視

nilabnilab のブックマーク 2009/07/24 10:54

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

ECナビ デベロッパー ネットワーク: NavicSearch API で利用しているTokenizer 0.5

    NavicSearch APIで利用している Tokenizerは, Solr付属のCJKTokenizerとほぼ同等の動きをします. ラテン文字についてはスペースで分割してTokenを作成. 非ラテン文字については bi-gram でTokenを切り出します. ...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう