タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

herokuと形態素解析に関するmsuharaのブックマーク (1)

  • Herokuの全文検索事情

    こんにちは。 Herokuで全文検索(当然日語)を行う場合にどういう選択肢があるのか調査したのでそのレポートを書いてみます。 ★評価のポイント Herokuには複数の全文検索Addonがあり、またPostgreSQLにも全文検索の機能があるのですが今回評価のポイントとしたのは以下の2点です。 ・日語に対応しているか? 全文検索は英語などのヨーロッパ圏の言語と、日語などのアジア圏の言語(CJK)では実装の難易度が大きくが異なります。 英語なんかは単語がスペースや改行などのホワイトスペースで区切られているので、単語の分割で悩む必要がないんですね。一方の日語の文章は基的に切れ目なく連続して記述されるのでどうにかして単語を分割しなければなりません。 この単語分割の方法には「形態素解析」と「N-gram」という2つの有力なロジックがあってそれぞれに特徴があるのですが、とりあえずそこはまぁど

  • 1