タグ

fulltextsearchに関するstanakaのブックマーク (6)

  • Apache Hadoop - Wikipedia

    Hadoop consists of the Hadoop Common package, which provides file system and operating system level abstractions, a MapReduce engine (either MapReduce/MR1 or YARN/MR2)[32] and the Hadoop Distributed File System (HDFS). The Hadoop Common package contains the Java Archive (JAR) files and scripts needed to start Hadoop. For effective scheduling of work, every Hadoop-compatible file system should prov

  • Apache Lucene - Wikipedia

    Apache Lucene is a free and open-source search engine software library, originally written in Java by Doug Cutting. It is supported by the Apache Software Foundation and is released under the Apache Software License. Lucene is widely used as a standard foundation for production search applications.[2][3][4] Lucene has been ported to other programming languages including Object Pascal, Perl, C#, C+

  • 全文検索エンジンSedueベンチマーク

    全文検索エンジン性能評価 (2006/08/19) 概要 弊社が開発致しました圧縮インデックス方式全文検索エンジン「Sedue」(Sedue 24やGenome Sedueで利用されているエンジンSedue コア)とオープンソースな全文検索エンジン(HyperEstraier, Lucene, Senna)との性能比較を行いました。検索サーバーにはマシン1台のみを使用しました。 更新履歴 2006/09/13 インデクシングの作成方法に関して分かりにくい表現を訂正 使用環境 ベンチマークを取るに際しまして以下のようなスペックのマシンを使用致しました。 CPU: AMD Athlon(tm) 64 Processor 3000+ Memory: 2GB OS: Linux pfidev1 2.6.16-1.2111_FC4 #1 Sat May 20 20:00:28 EDT 2006 x8

  • カイハツニッキ(2005-09-26) 全文検索系

    _ [ソフトウェア] 全文検索エンジン評価(Hyper Estraier / Rast / Senna) 現在(流行気味の)オープンソースの全文検索エンジンは、メジャーどころだとタイトルに挙げた Hyper Estraier Rast Senna) の3つがあります(他にもすげーのがあったら教えてください!)。テキストが集まってくる系(どんな系だ)のアプリケーションだと全文検索はかなり重要な要素を占めてくる技術要素となります、ので結構真剣に評価する必要があるわけです。とはいっても運用という面ではあまり高いサービスレベルは求められないことがおおいので、別のエンジンに入れ替える、っていうのも結構出来ちゃいそうですけどね。 さて、評価のポイントはいろいろあるんですが敢えて五月雨式に書くと 1インスタンスでどれくらい大量のテキストに耐えられるか どれくらいのスケーラビリティがあるか 更新のパフォー

  • Fulltext index on SQLite

    もうすぐ SQLite に全文検索がつく. Wiki を見ていて気付いた. (Full-text Search for SQLite) なかなか頑張ってるみたい. 他のデータベースは既に全文検索をサポートしている. 商用のものはもちろん, PostgreSQLMySQL も 対応済. 一方で, Java 製インプロセス RDB の HSQL や Derbyy は対応していない. (Wiki を見ると提案されてはいるようす.) 大物 DB には追いつかないにせよ, 他の軽量 DB よりは一足先を行くかんじ. 数ある DB の要件から全文検索をえらぶあたりがピンポイントでいい. 小さな規模のアプリケーションでも検索が使えたら嬉しいよね. コードは CVS に入っている. このへん. とりあえずチェックアウトして試そうと思いレポジトリを覗いてみると, コードはあるけど Makefile が

  • RDB の FTS 拡張

    2006-10-02 近況 sqlite を眺めていたとき私がもともと何をしていたかというと, RDB への全文検索(Fulltext Search: FTS)をつなぎ方を探していた. flino で使った HSQL は FTS に対応していない. 以前 Lucene あたりを繋げないものかとコードを覗いたけれど, 敷居は高そうだった. (Java のくせに sqlite より modular でない気がする.) よく見ると HSQLBLOB にも対応していない. 結局ファイルと Lucene をアプリケーション側で管理している. いまいち. で, 今回はそのリベンジを目論んでいたのだった. (結局 sqlite をいじっているうちにストレス解消は完了.) 世の中を眺めてみると, RDB に FTS を繋ごうとする試みは多い. MySQL や PostgreSQL は FTS に対応

  • 1