タグ

全文検索に関するiR3のブックマーク (20)

  • MySQL 5.7 InnoDB 日本語全文検索

    2016年2月9日に開催された「MySQLとPostgreSQLと日語全文検索」での発表資料です。 https://groonga.doorkeeper.jp/events/35295 発表時間の関係で、説明を割愛したスライドも含めてます。 ※「MySQLとPostgreSQLと日語全文検索2」での発表資料は以下参照 http://www.slideshare.net/yoyamasaki/mysql-57-innodb Read less

    MySQL 5.7 InnoDB 日本語全文検索
    iR3
    iR3 2016/02/12
    ふむふむ
  • groongaをRackに載せて全文検索 - 2009-07-31 - ククログ

    Ruby/groongaのサンプルアプリケーションのデモを用意しました。 クリアコードのサイトを「ruby」で検索 RailsなどのWebアプリケーションフレームワークを使うほどのものではないので、ActiveGroongaは使わずに、Ruby/groongaとRackの組み合わせになっています。Rackについてはyharaさんの5分でわかるRackなどを読んでみてください。 デモはPassengerで動かしています。PassengerにRackを設置したことがある人なら10分もかからずにサンプルを動かせるのではないかと思います。 機能 デモを見てもらえばわかる通り、小さなサンプルですが以下のように一通りの機能は備えています。 複数キーワードによる絞り込み スコア順による並べ替え 検索キーワードの正規化(「Ruby」でも「ruby」でも検索可能) キーワード周辺の文章の表示 それぞれ、もう

    groongaをRackに載せて全文検索 - 2009-07-31 - ククログ
  • [ThinkIT] 第4回:Ludiaを体験 (1/4)

    第3回では、オープンソースの全文検索システム「Ludia」を導入するための準備をすすめてきました。今回は、Ludiaに必要なソフトウェアいれ、実際に全文検索を行ってみます。 さて、前回解説したようにLudiaのダウンロードが終わっていたら、それをFedora Core 6にインストールしていきます。現在、Ludiaはtarballでの提供のみですので、ソースからコンパイルしていきます。インストールは、MeCab、MeCab辞書、Senna、Ludiaの順序で行います。それでは、順に説明していきます。

  • PostgreSQL 8.3の全文検索機能(TSearch2)を日本語で利用する

    (Last Updated On: 2018年8月13日)PostgreSQL 8.3.0から、ユーザから提供されている追加機能(contrib)として利用できた全文検索機能(TSearch2)が体に取り込まれました。 体に取り込まれたため、PostgreSQL 8.3.0以降ではソースから構築する場合に ./configure make make install と実行するだけで全文検索機能が利用できるようになりました。 TSearch2は単語単位で全文検索できます。しかし、日語のように単語に区切りがない場合、単語に分解(形態素解析)してからインデックス化する必要があります。 # N-gramは使えません。 残念ながら日語をそのまま扱える機能はPostgreSQL 8.3では実装されていません.しかし、TSearch2(textsearch)を日語で利用するための追加機能がpg

    PostgreSQL 8.3の全文検索機能(TSearch2)を日本語で利用する
  • “最適な”全文検索システムの選択 (2/2)- @IT

    もう一度、構成技術要素について簡単に紹介しよう。LudiaはNTTデータが開発した、PostgreSQLに全文検索機能を追加するためのオープンソースのソフトウェアである。 NTTデータが公開した資料によれば、PostgreSQL内に、テーブル内テキストデータに対する全文検索インデックスを作成することで、商用のデータベース管理ソフトに匹敵する高速・高精度な全文検索機能を可能にしている。 また、SQLと親和性が高く、扱いやすいインターフェイスが特徴である。インデックス作成にはオープンソース全文検索エンジンSennaを利用し、N-gramと形態素解析のインデックス主要2方式に対応している。 さらに、検索方法もブーリアン検索、近傍位置検索、類似文書検索の複数の検索に対応している。検索結果の合致度を示すスコア取得機能も備えている。 一方、acts_as_ludiaは、Ruby on RailsからL

  • Apache Lucene - Overview - Apache Lucene

    Apache Lucene sets the standard for search and indexing performance Apache Lucene Core Apache Lucene™ is a high-performance, full-featured search engine library written entirely in Java. It is a technology suitable for nearly any application that requires structured search, full-text search, faceting, nearest-neighbor search across high-dimensionality vectors, spell correction or query suggestions

    Apache Lucene - Overview - Apache Lucene
  • [Think IT] 第1回:OSS検索エンジンLuceneとは (1/3)

    「JBoss Enterprise Application Platformの全貌」では全4回にわたって、JBoss Enterprise Middleware全般について解説している。 連載ではJBoss Enterprise Middlewareを使った具体例として「エンタープライズレベルの検索サービス」を提供するWebアプリケーションを取り上げ、試作する。なお、検索エンジンにはオープンソースソフトウェア(以下、OSS)のApache Lucene(以下、Lucene:ルシーン)を使用する。 ここで述べる「エンタープライズレベルの検索(注1)」サービスとは、企業が保有する大量のコンテンツを高速に検索するサービスのこととする。Luceneは小規模(文書数が数万件以下)から大規模(数百万件以上)のコンテンツを高速に検索することを得意としているため、「エンタープライズレベルの検索」に適して

  • RailsとSolrによる全文検索のデモ

    RailsとSolrによる全文検索のデモ 〜 ロンウイット、OSSの検索エンジンSolrをRailsから使用する デモ構築方法に関するホワイトペーパーをリリース 〜 株式会社ロンウイット(社:東京都千代田区、代表取締役社長:関口宏司、以下ロンウイット)は日、「10分で簡単!RailsとSolrの全文検索デモ構築」と題したホワイトペーパーの公開を発表しました。ホワイトペーパーにはオープンソースの検索エンジンApache Solr(以下Solr)を、Ruby on Rails(以下Rails)のアプリケーションから使用するデモの構築方法が掲載されています。 Solrは高性能全文検索ライブラリApache Lucene(以下Lucene)を使って構築された、「検索エンジンサーバ」です。もとはCNET社(http://www.cnet.com/)のために構築された検索エンジンフレームワ

  • 株式会社ロンウイット/製品比較

    商用検索エンジンは小規模なものは数十万円、大規模なものになると数千万〜数億円ものライセンス費用がかかってきます。しかし、Lucene/Solrはエンタープライズ・レベルの大規模システムに対応できるだけでなく、ライセンス費用が不要です。そのため、浮いたお金を開発費用に充ててアプリケーションの機能の充実化や品質向上を図ったり、ハードウェア費用に充ててバックアップ体制を強化することなどが可能となります。 また、商用検索エンジンの中には高価なハードウェアを必須要件としているものがあり、これも導入時の費用を押し上げる原因となっています。Lucene/Solrはそのような特別なハードウェアを必要としません。 検索エンジンの処理速度で最も重要かつ注目されるのが検索応答時間です。最新の検索エンジンはいずれも「転置索引」を作成して検索を実行する方式のため、単純な検索だと検索処理時間の差があまり出ません。

  • 100万件の特許情報の登録 | 関口宏司のLuceneブログ

    一定期間更新がないため広告を表示しています

    100万件の特許情報の登録 | 関口宏司のLuceneブログ
  • MeCab: Yet Another Part-of-Speech and Morphological Analyzer(形態素解析エンジン)

    MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧ください メーリングリスト 一般ユーザ向けメーリングリスト 開発者向けメーリングリスト 新着情報 2008-02-03 MeCab 0.97 マルチスレッド環境で辞書を開くときの排他制御がうまくいっていなかったバグの修正 Windows版でインストール時に辞書の文字コードを指定できるようになった 一部のコンパイラで正しくコンパイルできなかった問題の修正 部分解析モードを変更するAPI の追加 (Tagger::set_partial()) ラティスの生成レベルを変更するAPI の追加 (Tagger::set_lattice_level()) 温度パラメータを変更するAPIの追加 (Tagger::set_theta()) 全候補出力モードを変更するAPIの追加 (Tagger::set_all_morphs()) 2007-

    iR3
    iR3 2008/11/21
    和布蕪
  • Senna 組み込み型全文検索エンジン - Senna 組み込み型全文検索エンジン

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • 全文検索 JiroSearch オープンソース(GPL) | Lucene

    JiroSearchとは 「JiroSearch」 は、様々な全文検索ニーズに対応できることを目指し、オープンソースとJavaで開発された全文検索エンジンです。 面倒な設定作業やコーディング作業なしに、全文検索機能を導入することが出来るとともに、様々な検索ニーズに合致したカスタマイズを行うことができます。 基的な特徴 Webサイト内の日語全文検索「namazu」と同様のことができます オープンソース(GPLライセンス)ですので、無償で利用することができます Linux, Windowsのサーバ上で動作します インストールして、そのまま利用していただくことができます N-gram形式のインデックス生成型の全文検索として動作します 検索対象ファイルの自動更新を可能にします CSSファイルを直すことで検索結果ページのデザインを変更することができますjspファイルを修正することで、自由に検索結

  • OSSTech、オープンソースの全文検索システム「キメラ・サーチ」

    オープンソース・ソリューション・テクノロジ株式会社(以下、OSSTech)は12月5日、オープンソースの全文検索システム「キメラ・サーチ」を発表した。価格は50万円(税別)から。 キメラ・サーチは、LinuxやUnixの上で動作するオープンソースの全文検索システム。SMB・CIFSプロトコルをサポートしていれば、Windows/Linux/UNIX/Mac OS Xのファイルサーバー上のコンテンツも検索可能。また、Winodwsファイルサーバーのアクセス権に対応しているため、ユーザーがアクセス権を持たないファイルを検索結果に表示させないこともできる。 プログラム言語にRubyおよびRuby On Rails、全文検索システムにHyper Estraierといずれもオープンソースを利用しているため、安価に導入が可能なほか、Hyper Estraierによりインデックスを使った高速検索、N-g

  • LudiaFrontPage - Ludia Wiki

    TypeError 'dict' object is not callable If you want to report a bug, please save this page and attach it to your bug report. Show debugging information Report bug Visit MoinMoin wiki Traceback A problem occurred in a Python script. Here is the sequence of function calls leading up to the error, in the order they occurred. /home/groups/l/lu/ludia/python/lib/python2.4/site-packages/MoinMoin/request.

  • SourceForge.jp: Project Info - Ludia

    Ludiaは高速かつ高精度な全文検索インデックス機能をオープンソースのデータベース管理システムであるPostgreSQLに提供します。Ludiaは株式会社NTTデータにより開発され、2006年10月11日にLGPLライセンスのオープンソースソフトウェアとして公開されました。 ダウンロード 最新リリース ludia 1.5.2 (日付: 2009-03-27) ludia-withdeps 1.5.1 (日付: 2008-08-07) ludia 1.5.1 (日付: 2008-08-07) ludia-withdeps 1.5.0 (日付: 2008-03-25) ludia 1.5.0 (日付: 2008-03-25)

    SourceForge.jp: Project Info - Ludia
    iR3
    iR3 2008/11/21
    Ludia
  • 全文検索エンジンSedue 24 - 製品仕様

  • Namazu: a Full-Text Search Engine

    What's Namazu Namazu is a full-text search engine intended for easy use. Not only does it work as a small or medium scale Web search engine, but also as a personal search system for email or other files. (The Japanese word `Namazu' means `catfish' in English.) Table of contents News Features License Download Stable source code deb packages for Debian GNU/Linux Windows edition Search Tutorial Manua

  • オープンソースの全文検索システム「Namazu 2.0.15」がリリース | エンタープライズ | マイコミジャーナル

    Namazu Projectは29日、オープンソースの日語全文検索システム「Namazu 2.0.15」をリリースした。セキュリティ修正版に位置付けられるv2.0.14を除くと、バージョンアップは約1年9カ月ぶり。対象プラットフォームは特定されていないが、Linux、FreeBSD、OpenBSD、NetBSD、Solaris、Mac OS XのUNIX系OSに加え、32bitWindowsで動作が確認されている。 今回のバージョンでは、GnumericやKOffice(KWord/KSpread/KPresenter/Kivio)、OpenOffice.org 2.0 OpenDocumentフォーマットなど、PC-UNIXを中心に利用されている文書に対応。--decode-base64オプションを有効にしてビルドした場合には、メール添付ファイルやMHTML文書にも対応する。また、Z

  • qwik.jp - qwik リソースおよび情報

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

    iR3
    iR3 2008/03/10
  • 1