タグ

ブックマーク / arika.org (1)

  • Octopress/JekyllでGroongaによる類似文書検索機能を使う

    Groonga 2.0.2から類似文書検索機能が使えるようになった。GroongaのRubyバインディングであるRroongaでは2.0.3で同機能への対応がなされている。 Groongaレベルではselect ... --filter カラム名 *S "テキスト"により類似文書検索ができる。このときに指定するカラムは全文検索できるようインデックスを作っておかなければならない。 Rroongaからの使い方は以下のようになる。(Article.bodyに抽出対象のテキストがあるとする。) records = Groonga['Article'].select do |record| record.body.similar_search(article_body) end records.sort([ {key: '_score', order: 'descending'}, ], limit

  • 1