タグ

postgresqlとsearchに関するwebmarksjpのブックマーク (2)

  • NTTデータが全文検索エンジン「Ludia」をオープンソースとして無償公開:ITpro

    NTTデータは10月11日,同社が開発した全文検索エンジン「Ludia」をオープンソース・ソフトウエアとして無償公開した。オープンソースのDBMS PostgreSQLに格納されたテキスト・データの全文検索を行う。同社では「商用のデータベース管理ソフトに匹敵する速度と精度を備える」としている。 NTTデータでは「データベース内のデータの全文検索ではこれまで,オープンソース・ソフトウエアでは日語に対応した高速・高精度なものが存在せず,データベースからデータを取り出し別のシステムを構築する必要があった。Ludiaは商用のデータベース管理ソフトに匹敵する速度と精度を備える」としている。 Ludiaは,N-gramと形態素解析の2種類の全文検索インデックス方式をサポートする。ブーリアン検索,近傍位置検索,類似文書検索といった検索が可能で,検索結果の合致度を示す「スコア」も提供する。 Ludiaは

    NTTデータが全文検索エンジン「Ludia」をオープンソースとして無償公開:ITpro
  • PostgreSQL 8.3の全文検索機能(TSearch2)を日本語で利用する

    (Last Updated On: 2018年8月13日)PostgreSQL 8.3.0から、ユーザから提供されている追加機能(contrib)として利用できた全文検索機能(TSearch2)が体に取り込まれました。 体に取り込まれたため、PostgreSQL 8.3.0以降ではソースから構築する場合に ./configure make make install と実行するだけで全文検索機能が利用できるようになりました。 TSearch2は単語単位で全文検索できます。しかし、日語のように単語に区切りがない場合、単語に分解(形態素解析)してからインデックス化する必要があります。 # N-gramは使えません。 残念ながら日語をそのまま扱える機能はPostgreSQL 8.3では実装されていません.しかし、TSearch2(textsearch)を日語で利用するための追加機能がpg

    PostgreSQL 8.3の全文検索機能(TSearch2)を日本語で利用する
  • 1