タグ

Groongaに関するvaldaのブックマーク (2)

  • groongaの全文検索処理の流れ - 2011-10-20 - ククログ

    groongaにデータを登録して、インデックスを更新すると全文検索をすることができます。ここでは、groongaが内部でどのような処理をして全文検索をしているかを説明します。 前提 まず、以下のように「Yes good」と「Hey good」という文書が登録されているとします。 このとき、「Yes good」で検索したらどうなるかを説明します。 トークナイズ まず、入力の「Yes good」をトークナイズします。このとき使用するトークナイザーは使用する転置インデックスと同じものです。転置インデックスが使用するトークナイザーは語彙表(lexcion)を見ればわかります。今回はTokenDelimitトークナイザーですね。 TokenDlimitは空白区切りでトークナイズするトークナイザーなので「Yes good」は「Yes」と「good」にトークナイズされます。 転置インデックスの参照 トー

    groongaの全文検索処理の流れ - 2011-10-20 - ククログ
  • groongaをRackに載せて全文検索 - 2009-07-31 - ククログ

    Ruby/groongaのサンプルアプリケーションのデモを用意しました。 クリアコードのサイトを「ruby」で検索 RailsなどのWebアプリケーションフレームワークを使うほどのものではないので、ActiveGroongaは使わずに、Ruby/groongaとRackの組み合わせになっています。Rackについてはyharaさんの5分でわかるRackなどを読んでみてください。 デモはPassengerで動かしています。PassengerにRackを設置したことがある人なら10分もかからずにサンプルを動かせるのではないかと思います。 機能 デモを見てもらえばわかる通り、小さなサンプルですが以下のように一通りの機能は備えています。 複数キーワードによる絞り込み スコア順による並べ替え 検索キーワードの正規化(「Ruby」でも「ruby」でも検索可能) キーワード周辺の文章の表示 それぞれ、もう

    groongaをRackに載せて全文検索 - 2009-07-31 - ククログ
  • 1