タグ

全文検索に関するeichisandenのブックマーク (4)

  • テキスト検索の方法とインデックス | Let's POSTGRES

    板垣 貴裕 テキスト検索にもさまざまな方法があります。大量のテキストを検索するにはインデックスを使って検索したいところですが、どんな検索にも応えられるインデックスというものは、さすがに存在しません。それぞれのアプリケーションの条件に適したテキスト検索方法やインデックスの張り方を選んで行きましょう。 今回説明するテキスト検索の方法の一覧を以下に挙げます。PostgreSQL ユーザが「全文テキスト検索」というと「単語単位の検索」を指すことが多いようです。また、「中間一致検索」が「あいまい検索」と呼ばれることもあるようです。用語が厳密な意味で使われないことも多いようなので、文脈には注意して解釈してください。 「単語単位の検索」と「中間一致検索」では、追加のモジュールを導入することで日語全文検索が可能なインデックスを作成できます。こちらは説明の後半で紹介します。以下、記事の内容です。 テキス

  • PostgreSQLでpg_bigmを使って中間一致like検索を高速化する - ほんじゃらねっと

    昨日書いた下記記事の続き。 blog.honjala.net 全角半角大文字小文字ひらがなカタカナを区別せず高速検索できるようには なったのだけど、肝心のlike検索でインデックスが使えず 遅いままだったので、pg_bigmを導入してこれを解決する。 pg_bigmは簡単に言うと日語の中間一致like検索でインデックスを 使えるようにしてくれるPostgreSQL用モジュール。 家サイトはこちら: pg_bigm pg_bigmの導入方法と使い方についてはこちらのSlideShareを参考にした: PostgreSQLでpg_bigmを使って日語全文検索 (MySQLとPostgreSQLの日語全文検索勉強会 発表資料) from NTT DATA OSS Professional Services www.slideshare.net pg_bigmを導入する pg_bigmはR

    PostgreSQLでpg_bigmを使って中間一致like検索を高速化する - ほんじゃらねっと
  • PostgreSQL 9.3 : pg_bigm導入メモ - Qiita

    はじめに like検索のシーケンシャルスキャンが遅く、データ量と精神的ストレスが溜まってきたので全文検索用のインデックスを貼ることにした。 その作業記録と個人的な備忘録としてこの記事を作成。 環境はUbuntu 14.04 LTS、PostgreSQL 9.3である。 調査段階 こちらのPGroongaとpg_bigmの比較結果を公開している大変有難いページを参考にした。 http://blog.createfield.com/entry/2015/02/03/094940 http://lab.aratana.jp/entry/2015/05/20/180000 比較結果を見るとPGroongaの方に軍配が上がるようだが、インストール手順をチラ見して楽そうなpg_bigmに決定。 また、pg_bigmの公式ページにはpg_trgmとの比較もあり、とりあえず日語で手っ取り早く高速な全文検

    PostgreSQL 9.3 : pg_bigm導入メモ - Qiita
  • PostgreSQLの日本語対応全文検索モジュールpg_bigmとPGroongaを検証してみた - CreateField Blog

    はじめに 最近、Web系のエンジニア転職して、Railsをよく触っています。 Rails界隈では、HerokuかActiveRecordの関係かよくわかりませんがPostgreSQLが利用されていることが多いような気がします。 これまで個人的に全文検索のWebサービスを開発するためにGroongaとよく戯れていたのですが、最近はなかなか戯れることができていません。 最近になってRailsとPostgreSQLを触りはじめたという状況ですが、先日、PostgreSQLでGroongaが使えるPGroonga 0.20がリリースされたようです。 PostgreSQLで簡単に日語対応で高速な全文検索が使えるようになるなんて素晴らしいじゃないですか。 最近はRailsの使い方ばっかり調べていて、若干知識欲が満たされない感があったので、PostgreSQLの知識向上がてら、PGroongaと、P

    PostgreSQLの日本語対応全文検索モジュールpg_bigmとPGroongaを検証してみた - CreateField Blog
  • 1