タグ

全文検索に関するlove0hateのブックマーク (4)

  • Groonga - カラムストア機能付き全文検索エンジン

    Groongaについて Groongaはオープンソースのカラムストア機能付き全文検索エンジンです。Groongaを使うと全文検索機能付き高性能アプリケーションを開発することができます。 特徴 最新リリース 2024-09-03にリリースされた14.0.7が最新リリースです。 インストール ソース 最新記事 Groonga 14.0.7リリース (2024-09-03) Groonga 14.0.6リリース (2024-07-29) PostgreSQL用高速日語全文検索モジュールPGroonga(ぴーじーるんが) 3.2.1リリース (2024-07-04) Groonga 14.0.5リリース (2024-07-04) Groonga 14.0.4リリース (2024-05-29) Groonga 14.0.3リリース (2024-05-09) Groonga 14.0.2リリース (

    Groonga - カラムストア機能付き全文検索エンジン
  • 全文検索システムの比較 - Elasticsearch vs Solr vs Amazon CloudSearch

    全文検索システムの比較 - Elasticsearch vs Solr vs Amazon CloudSearch February 10, 2014 at 01:05 AM | categories: solr, aws, elasticsearch, web | 候補の選定方法 候補を選定するにあたって、以下の特徴をもっていることを前提とした。 LuceneやGroongaを使えば何でもできるが、ここでは対象としない。 ウェブベースのインターフェースを持つ インデックスの更新はほぼリアルタイムに反映される スケールアウトが容易 Solr https://lucene.apache.org/solr/ Luceneをバックエンドにした全文検索システム。バージョン4になってから大幅に機能が増強された。 長所 実績が十分ある 機能豊富 短所 クラスタを構築して運用するには手間がかかりそう S

    全文検索システムの比較 - Elasticsearch vs Solr vs Amazon CloudSearch
  • ハクビシンにもわかる全文検索 - Qiita

    高速な全文検索アルゴリズムであるFM-indexについて解説する。理解しがたい点や間違っている点があれば是非コメントで指摘してほしい。 概要 FM-indexはリニアな文字列に対して検索をするアルゴリズムで、主に簡潔データ構造とBWT(およびLF mapping)という二つのアイデアから成り立っている。BWTはBurrows-Wheeler変換のことで、文字列を特殊な並び順に変換するという可逆関数である。BWTされた文字列を簡潔データ構造固有の操作をすることで、クエリ文字列の長さに比例した短い時間で文字列を探し出すのがFM-indexだ。 簡潔データ構造 簡潔データ構造に関してはFM-indexで必要となる二つの関数だけ説明して、詳細は次の機会に譲るとする。さて、二つの関数はともに文字列のある位置より前の部分に含まれている文字の数を数え上げるというものでrank()とrankLessTha

    ハクビシンにもわかる全文検索 - Qiita
    love0hate
    love0hate 2015/07/21
    興味深いだけに率直に。BWT逆変換の文章が良く分からない。
  • MySQLで高速日本語全文検索

    Mroongaについて MroongaはMySQL用のストレージエンジンです。すべてのMySQLユーザーに高速な日語全文検索機能を提供します。Mroongaは以前はGroongaストレージエンジンと呼ばれていました。 特徴 最新リリース 2024-09-06にリリースされた14.07が最新リリースです。 インストール 最新記事 Mroonga 14.07リリース! (2024-09-06) Mroonga 14.04リリース! (2024-06-12) Mroonga 13.05リリース! (2023-08-02) Mroonga 13.01リリース! (2023-04-17) Mroonga 13.00リリース! (2023-02-09) Mroonga 12.12リリース! (2023-01-29) Mroonga 12.11リリース! (2023-01-06) Mroonga 12

    MySQLで高速日本語全文検索
  • 1