[B! PostgreSQL][textsearch] micknのブックマーク

similarityをつかったゆるいbi-gram検索応用編 - 日々の記録別館

俺自身は「インタフェース」派なんだけどさ・・・前回の方式の問題さて、前回のエントリ(similarityをつかったゆるいbi-gram検索 - 日々の記録別館)で、N-gramのゆるい検索の一番基本的なパターンを示したのだけど、この方式にはまだまだ問題がある。前回はトークン辞書内に「センヌリティウス」に類似する語が一つ(「セリヌンティウス」)だけだったので、問題はなかったのだが、類似する語が複数存在すると、サブクエリで返却されるレコードがN件になるためエラーになってしまう。で、エラーを抑止するためにサブクエリ内でLIMIT 1で1件しか返却しないようにすれば、とりあえずの問題は回避できるのだが、そのやり方では、以下の様なケースに対応しきれない・・・表記ゆれが多数存在するケース日本語外来語には、この表記ゆれが多数存在するケースがしばしば見受けられる。例えば、代表的なものとして

mickn 2013/10/21

リンク

pg_bigm(ピージー・バイグラム)を用いた全文検索のしくみ(後編)

正式版は下記URLをご参照ください。 http://www.slideshare.net/hadoopxnttdata/pgbigm-39739507Read less

mickn 2013/10/21

リンク

pg_bigm(ピージーバイグラム)を用いた全文検索のしくみ

正式版は下記URLをご参照ください。 http://www.slideshare.net/hadoopxnttdata/pgbigm-39739489Read less

mickn 2013/10/21

リンク

pg_bigm

pg_bigm(ピージーバイグラム) pg_bigmは、PostgreSQL上で全文検索機能を提供するモジュールです。このモジュールを使うことで、ユーザは全文検索用のインデックスを作成でき、高速に文字列検索を行えるようになります。このモジュールは、2-gram(バイグラム)と呼ばれる方法で、文字列から全文検索用のインデックスを作成します。ニュース 2022-10-24: PostgreSQL15用のpg_bigm-1.2-20200228のRPMファイルをリリースしました。RPMファイルはこちらからダウンロードできます。 2022-10-13: pg_bigmバージョン 1.2 が PostgreSQL 15 に対応していることを確認しました。 2021-10-07: PostgreSQL14用のpg_bigm-1.2-20200228のRPMファイルをリリースしました。RPMファイルは

mickn 2013/10/21

リンク

第26回JPUGしくみ＋アプリケーション分科会勉強会 - 日々の記録別館

前回はたまたま旅行が重なってしまって出席出来なかったけど、今回は特に予定が入らなかったので勉強会に参加することにした。勉強会の公式：http://www.postgresql.jp/wg/shikumi/shikumi26/ 特に今回はどのテーマも聞いておきたいものばかり。 pg_bigm(ピージーバイグラム)を用いたPostgreSQLの全文検索のしくみ(前編) 9.3で進化した外部テーブル 10大ニュースで振り返るPGCon2013 今回も新たに書き起こすのが面倒なので、 #jpug_study のハッシュタグを元にメモを書く。今回は私の中継ツイートにもツッコミを入れるメンバいたのが良かったなあ。あと、私以外の人たちが結構いろいろ書き込んでくれていたのは助かった。どうでもいいけど勉強会直前に @kasa_zip 氏からこんなtweetが。 @kasa_zip 朝ラーメン、昼ラー

mickn 2013/10/21

リンク

全文検索

目次12.1. 導入12.1.1. 文書とは何か?12.1.2. 基本的なテキスト照合12.1.3. 設定12.2. テーブルとインデックス12.2.1. テーブルを検索する12.2.2. インデックスの作成12.3. テキスト検索の制御12.3.1. 文書のパース12.3.2. 問合わせのパース12.3.3. 検索結果のランキング12.3.4. 結果の強調12.4. 追加機能12.4.1. 文書の操作12.4.2. 問合わせを操作する12.4.3. 自動更新のためのトリガ12.4.4. 文書の統計情報の収集12.5. パーサ12.6. 辞書12.6.1. ストップワード12.6.2. simple辞書12.6.3. 同義語辞書12.6.4. 類語辞書12.6.5. Ispell辞書12.6.6. Snowball辞書12.7. 設定例12.8. テキスト検索のテストとデバッグ12.8.1

mickn 2013/10/21

リンク

Full-text search in Air Mozilla with PostgreSQL

In a previous post I explained why and how we migrated Air Mozilla to use PostgreSQL as the default database. We did this so we can leverage PostgreSQL’s powerful full-text search feature. First, off a tangent we go… Why not use the popular and also powerful full-text master ElasticSearch? Surely, since it’s built on top of Apache Lucene it’s bound to have some amazing full-text search and indexin

mickn 2013/10/21

リンク

はてなブックマーク

タグ

関連タグで絞り込む (0)

PostgreSQLとtextsearchに関するmicknのブックマーク (7)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス