タグ

2010年12月11日のブックマーク (4件)

  • postgresql/PostgreSQL8.4で全文検索を行う – memo

    PostgreSQL8.4で全文検索(textsearch-ja) 作成日 2010/09/15 特徴 形態素解析を使った全文検索機能。 文法的に整った文書を検索する場合に有効な方法である。 SQLのLIKE文に近い結果を得たい場合には適さない。 そのような用途の場合は、N-gramアルゴリズムを採用しているtextsearch_sennaを利用すると良い。 前置き 全文検索機能は、最近ではSolrが人気である。高速かつレプリケーション機能も付いておりスケールアウト(サーバを増やす事で性能を向上させる事)が可能である。 SolrはPostgreSQLとは独立した全文検索エンジンでJava+Tomcatで動作する(サーブレットなので、Tomcat以外でも動作する)。 しかしながら、それほど大きくない規模であればPostgreSQL上で全文検索機能を使えたほうが何かと便利である。 ここでは、P

  • textsearch_senna

    N-gram を使用した、組み込み型の日語全文検索です。 ダウンロード : ソースコードのほか、Windows 用バイナリもダウンロードできます。 バグレポート メーリングリスト への参加 概要 インストール テキスト検索機能 %% 演算子 @@ 演算子 インデックス (senna) インデックス・オプション (WITH) インデックスのメンテナンス senna.drop_index() senna.reindex_index() 不要ファイルの調査 TODO 概要 日語テキストの全文検索を行います。 形態素解析ベースである textsearch-ja とは異なり、textsearch_senna では N-gram ベースの全文検索を行います。 検索には、全文検索エンジン Senna を使用しています。 利点として、文字すべてをインデックス化するため LIKE 中間一致検索に近い結果

  • 試験管のなかのコード :: Ludia にチャレンジ

    Ludia にチャレンジ Ludia とは Ludiaは高速かつ高精度な全文検索インデックス機能をオープンソースのデータベース管理システムであるPostgreSQLに提供します。Ludia は株式会社NTTデータにより開発され、2006年10月11日にLGPLライセンスのオープンソースソフトウェアとして公開されました。 ということで、PostgreSQLに全文検索機能付加するソフトウェア。 Senna, MeCab との連携機能を PostgreSQL に追加してくれる。 全文検索エンジン(Lucene とか Hyper Estraier とか)を管理する手間が省けるので、中小規模の全文検索が必要な場合にはとても便利そうだ。 Ludia http://sourceforge.jp/projects/ludia/ Senna http://qwik.jp/senna/FrontPageJ.h

  • Display tag libraryを試す - 己メモ

    Display tag library http://displaytag.sourceforge.net/11/ を試してみました。 非常に簡単にページングや列のソートが行なえます。 試した時のJSPは以下の感じ。 <%@ page contentType="text/html;charset=Shift_JIS" pageEncoding="Shift_JIS" %><%@ taglib uri="/WEB-INF/struts-html.tld" prefix="html" %><%@ taglib uri="/WEB-INF/struts-logic.tld" prefix="logic" %><%@ taglib uri="/WEB-INF/struts-bean.tld" prefix="bean" %><%@ taglib uri="http://displaytag.sf.

    Display tag libraryを試す - 己メモ