わんだふるさーち。 PHPの勉強がてら、Wonderflの検索エンジンをつくってみた。本家の検索機能は、タイトルで検索しても引っかからないあまりに酷い仕様なので、誰か作らないかなと期待していたけど結局自分で作ってしまった。 Wonderflを静的にクロールした20000ページ弱のインデックスを置いている。まだクォーテーションを入れていないので、スペース入りの検索ができない(license:"MIT license"とか)。 クローリング:Java&wget インデクシング:Java(Lucene(CJKAnalyzer)) 検索:PHP(Zend_Search_Lucene) 個人的にご褒美あげたいのはソートのところ。Zend_Search_Luceneのソート機能では全Documentにアクセスしにいくためすごく時間がかかるが、インデックスの作成時に、ソート順を記したファイルを別に作って