tomoemonのブックマーク / 2010年8月23日

tomoemon id:tomoemon

2010年8月23日のブックマーク (7件)

開発メモ: 作者が語る Hyper Estraierのすべて
tomoemon 2010/08/23
全文検索
リンク
ウノウラボ Unoh Labs: Tips for HyperEstraier
先月、VX Revolution VX-Rを購入して、その使い心地の良さに素直に感動しているbokkoです。 HyperEstraier HyperEstraierは平林幹雄さんが開発されている全文検索エンジンです。全文検索エンジンとして使えるのはもちろん、全文検索のためのライブラリとして使うこともできます。ウノウではHyperEstraier(以下HE)をフォト蔵の写真検索に利用しています。今回はHEの活用や運用に関するTipsについて紹介します。インデックスの作成 HEのインデックスを作成する方法はいくつかありますが、単にデータが空のインデックスを作るのであれば以下で十分です。 $ estcmd create idx 実際には想定されるインデックスのサイズなどに応じてオプションを追加するといったことが必要になるでしょう。ファイルやディレクトリ(内のファイル)をインデックスに追加する
tomoemon 2010/08/23
全文検索
リンク
LuceneとSennaの比較：クエリー書式編（後編） | 関口宏司のLuceneブログ
一定期間更新がないため広告を表示しています
tomoemon 2010/08/23
全文検索
リンク
MySQL :: MySQL 8.0 リファレンスマニュアル :: 12.10 全文検索関数
MATCH (col1,col2,...) AGAINST (expr [search_modifier]) search_modifier: { IN NATURAL LANGUAGE MODE | IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION | IN BOOLEAN MODE | WITH QUERY EXPANSION } MySQL では、次のような全文インデックス設定および検索がサポートされています。 MySQL の全文インデックスは、型 FULLTEXT のインデックスです。全文インデックスは、InnoDB または MyISAM テーブルでのみ使用でき、CHAR、VARCHAR、または TEXT カラムにのみ作成できます。 MySQL には、中国語、日本語および韓国語 (CJK) をサポートする組込みの全文 ngram パーサー
tomoemon 2010/08/23
"title と body を別々に検索したい場合は、各カラムに別々の FULLTEXT インデックスを作成する必要があります"

mysql

全文検索
リンク
MySQL :: MySQL 8.0 リファレンスマニュアル :: 8.3.1 MySQL のインデックスの使用の仕組み
インデックスは特定のカラム値のある行をすばやく見つけるために使用されます。インデックスがないと、MySQL は関連する行を見つけるために、先頭行から始めてテーブル全体を読み取る必要があります。テーブルが大きいほど、このコストが大きくなります。テーブルに問題のカラムのインデックスが含まれている場合、MySQL はすべてのデータを調べる必要なく、データファイルの途中のシークする位置をすばやく特定できます。これはすべての行を順次読み取るよりはるかに高速です。ほとんどの MySQL インデックス (PRIMARY KEY、UNIQUE、INDEX、および FULLTEXT) は B ツリーに格納されます。例外: 空間データ型のインデックスは R ツリーを使用します。MEMORY テーブルはハッシュインデックスもサポートします。InnoDB は FULLTEXT インデックスの逆のリスト
tomoemon 2010/08/23
MySQLのLIKEはTurbo Boyer-Moore アルゴリズム

mysql

文字列処理
リンク
検索の歴史一文字進化するのに掛かった年数は、なんと… - 当面C#と.NETな記録
文字列の高速検索の歴史を年表にしてみたんだけど、年表にしたらめちゃくちゃおもしろいことに気づいてしまいました！今日のエントリーは必見ですよ！ id:siokoshou:20060323 に書いた EXACT STRING MATCHING ALGORITHMS に各論文の発表された雑誌が載ってたので、年表に並べてみました。いろいろ検索しててあちこちでみかけた名前だけ並べてます。 1977 KMP 1977 BM (Boyer-Moore algorithm) 1980 BMH (Horspool algorithm) 1990 Sunday Quick Search algorithm 1992 Shift Or algorithm 1992 Turbo-BM algorithm (繰り返し対策.DNAのように文字種の集団が小さい場合に有効) んで、注目のポイントはここ。 1980 BMH
tomoemon 2010/08/23
アルゴリズム

文字列処理
リンク
Blog - Mikula Beutl - SEO Consulting
This guide is the safest way to do a domain switch, you get all you need to change a blocked domain. What is a user flow and a user journey? There’s a macro view of a customer experience that we can analyze and partially control.
tomoemon 2010/08/23
font
リンク
- 2010年8月31日
- 2010年8月23日
- 2010年8月22日