タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

PostgreSQLとsearchに関するYasSoのブックマーク (5)

  • PostgreSQL 8.3の全文検索機能(TSearch2)を日本語で利用する

    (Last Updated On: 2018年8月13日)PostgreSQL 8.3.0から、ユーザから提供されている追加機能(contrib)として利用できた全文検索機能(TSearch2)が体に取り込まれました。 体に取り込まれたため、PostgreSQL 8.3.0以降ではソースから構築する場合に ./configure make make install と実行するだけで全文検索機能が利用できるようになりました。 TSearch2は単語単位で全文検索できます。しかし、日語のように単語に区切りがない場合、単語に分解(形態素解析)してからインデックス化する必要があります。 # N-gramは使えません。 残念ながら日語をそのまま扱える機能はPostgreSQL 8.3では実装されていません.しかし、TSearch2(textsearch)を日語で利用するための追加機能がpg

    PostgreSQL 8.3の全文検索機能(TSearch2)を日本語で利用する
  • ファイルサーバをPostgreSQLで全文検索 - Kamoland 不定期日記

    2007年12月02日 ファイルサーバをPostgreSQLで全文検索   ( PostgreSQL) 以前,部屋のファイルサーバのファイルを全文検索するために,OracleSESの試用版を入れてみた. ・RedHat9へのOracleSES10gインストール しかしOracle+Javaなのでメモリをうし,そのページにも書いているように細かい点で気に入らないところがある. そしてそもそもお試し版だ.(確か正式版は数100万円するはず) そこで,自分で全文検索システムを作ることにした. 作成結果→ [ファイルサーバをPostgreSQLで全文検索] エンジンはPostgreSQLのtsearch2を使う.また,ポスグレは8.3からはtsearch2が体に内蔵されるようなので,8.3(まだベータだが)を使うことにした. PostgreSQLの全文検索設定と,検索クエリーの作り方につ

    YasSo
    YasSo 2008/02/12
    「to_tsquery()をかましてキーワードもnormalization」
  • [PostgreSQLウォッチ]第32回 PostgreSQL 8.2の全文検索機能

    8.2の正式リリース時期は? 現在β3までリリースされているPostgreSQL 8.2の正式版のリリース時期だが,この記事を執筆している時点では12月5日とされている。少し早めのクリスマスプレゼントという感じのリリースになりそうだ。楽しみにしておこう。 GIN再び PostgreSQLウォッチ第30回ではPostgreSQL 8.2の追加機能について報告した。今回は,そのとき取り上げた汎用転置インデックスGINに関する追加調査結果を報告する。 GINを使うと今まで不可能だった,データベース中のテキストのインデックスを使った高速な全文検索が可能であることは既に報告したとおりだ。しかし,その後しばらく使ってみると,いくつか問題点が見つかった。 (1) 重複した単語が登録されるので無駄 (2) 大きなテキストでは,データ登録に時間がかかるだけでなく,メモリーを消費する (1)に関してはGINに

    [PostgreSQLウォッチ]第32回 PostgreSQL 8.2の全文検索機能
  • スラッシュドット ジャパン | PostgreSQL用の日本語対応全文検索エンジン「Ludia」

    sillywalk曰く、"ITProの記事によれば、NTTデータは10月11日、同社が開発した全文検索エンジン「Ludia」をLGPLにより無償公開したと発表しました。PostgreSQLに格納されたテキストデータの全文検索が可能で、「オープンソースソフトウエアでは日語の全文検索に対応した高速・高精度なものが存在せず、データベースからデータを取り出し別のシステムを構築する必要があった。Ludiaは商用のデータベース管理ソフトに匹敵する速度と精度を備える」(NTTデータ)としています。Ludiaは、N-gramと形態素解析の2種類の全文検索インデックス方式をサポートし、またブーリアン検索、近傍位置検索、類似文書検索といった検索が可能で、検索結果の合致度を示す「スコア」も提供するそうです。" バックエンドには組み込み用全文検索エンジンsennaを使っている様である。

    YasSo
    YasSo 2006/10/12
    Tsearch2+MeCabより簡単で良さそうなら乗り換えを考えよう。
  • plotless: UTF-8での全文検索メモ(PostgreSQL + Tsearch2 + MeCab 編)

    慣れない perl に苦戦しているわけですが、"Bad free() ignored (PERL_CORE)" って警告が出てくる原因がイマイチわかりません…。 perl5.8を入れ直してみようかとportsでコンパイルするとエラーが出るようになるし…。困ったなぁ…。 で、それとは関係なくポスグレのTsearch2 + MeCabを使った全文検索の仕方を忘れないようにメモメモ。 参考にしたのは以下のページ。 https://www.oss.ecl.ntt.co.jp/tsearch2j/index.html http://www.emaki.minidns.net/Programming/postgres/index.html --- 環境 ・FreeBSD 5.4 ・PostgreSQL 7.4.13 インストール済み (/usr/ports/databases/postg

  • 1