タグ

テキスト検索に関するakkun_choiのブックマーク (6)

  • Tagの検索にMySQLの全文検索を使う : blog.nomadscafe.jp

    Tagの検索にMySQLの全文検索を使う Tags with MySQL fulltextを参考にして試してみた。 Femoの中で、タグの絞り込み機能を実装したのに続いて、「完了」や「finish」と言ったタグがついている場合表示しないというオプションを考えている。 そうなってくると、SQLをどう書けばいいのか、また複雑なSQLを構築したときにパフォーマンスは大丈夫なのかと心配。そこで、上記のURLを参考にしながらMySQLの全文検索に注目。 create table ft_tags( id int unsigned not null auto_increment primary key, tags text, unpack text, fulltext (unpack) ) と言うテーブルを作成。 ここに、 my @tags = ( q/task femo/, q/femo mail t

  • LunaTear: MySQLで全文検索

    MySQLにて運用中のDBで、数万件入って居るテーブルにて全文検索をするために TextMsg like '%$search%'なんていう風にして検索していたんですが、どうも最近1回の検索に数秒かかるようになってしまったため、なんとか高速化できないものかと調べてみました。 まず、出てきた答えの一つが MATCH (列名) AGAINST ('検索文字');を使う方法。 これにはFULLTEXTインデックスという大きめのインデックスが必要になりますがその分高速化できるようです。 しかし

  • mysqlで日本語全文検索に挑戦! (Nega Diary)

    もう少しでできそうなのでメモ。 しかし、一昨日から、やたらめったら肩から首にかけて痛みがあって、辛いっす。 実験環境: OS X(10.2.8) MySQL 3.23.55 PHP 4.3.4 日語全文検索を可能とするアプローチとして、 1)対象文章を外部ファイルに保存して、Namazuを使って検索 2)Chasenを使って、分かち書きして、バイナリ化して、MySQLのFull Text を使う の2通りある。 まず、1の方法は、Namazuのインストールでつまずいてしまい、インストールを解説してるサイトの通りやっても、うまく行かなかったのであきらめる。 なので、2のChasenを使う方法で試す。 Chasen は、OSX用のバイナリがあるので、コンパイルの必要はない。 OS X Chasen パッケージ化されてるので、ダブルクリックでインストール完了。 次に、コマン

  • MySQLについて 伍 - インデックスについて

    通常、MySQLでは、selectコマンドを実行した場合、1レコード目から最終レコードまで、シーケンシャルに検索を行っていきます。 しかしながら、レコード数が大量になってくると、検索速度の問題が生じます。 そこで、より高速な検索を行うために、インデックスを作成するのが一般的です。 インデックスを作成することによって、検索速度は劇的に改善されます。 但し、MySQLでは、1,000件以下であればシーケンシャルに検索した方が速いとされています。 さて、インデックスとはどのようなものであるかというと、直感的には、図書の巻末に付されている索引(インデックス)と同じです。 索引語はアイウエオ順、あるいは、アルファベット順に並べられていて、各々の索引語には、その索引語が登場するページ数(位置情報)が示されています。 読者はその位置情報を頼りに、ページを捲って、目的のキーワードのある部分を読

  • Senna 組み込み型全文検索エンジン - Senna: An Embeddable Fulltext Search Engine

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

  • Brief Introduction to Suffix Array

    Last Modified: 2000-11-14 (Since: 2000-11-14) Suffix array is a data structure designed for efficient searching of a large text. The data structure is simply an array containing all the pointers to the text suffixes sorted in lexicographical (alphabetical) order. Each suffix is a string starting at a certain poinsition in the text and ending at the end of the text. Searching a text can be performe

  • 1