天然パーマの Erogeek「ゆーすけべー / yusukebe」の日記です 最近は Perl の話題が多くなっています はぁはぁ 昨日公開した「sugokuii beta」。 ある程度のトラフィックは予想していたものの、 深夜0時を超えた当たりから急に負荷が高くなった。 この深夜0時前... 続きを読む
catalyst, DBIC, sennaDBICでsenna(tritonn)のkwicを使ってみた。kwicってのはtritonnが提供しているgoogle検索結果っぽく表示してくれる関数。 my $kwic_query = 'me.wiki_text,\'150\',\'1\',\'1\',\'\',\'\','.$search_query.'\',\'\',\'\''; my $wikipedia ... 続きを読む
SennaSennaでは、UTF-8の文字列を正規化しています。たとえば、「?」は「ミリバール」に、「AbRACADAbra」は「abracadabra」に、「ハラヘッタZO」は「ハラヘッタZO」に変換されます。これで、文字のゆれに対応した検索ができるわけです。 さて、某サービスでWAVE D... 続きを読む
Sennaみんな、[Senna-dev 884]のメールは読んだかな!?全文検索エンジンSennaの新しいAPIについての素案がついに公開されました。 今までのAPIのほとんどを刷新するという大改造!劇的ビフォーアフター的API群です(APIの匠)。 んで、この新しいAPI群で何が... 続きを読む
UTF-8 で動く mecab と senna と MySQL の deb パッケージを作った i386 or amd64 用。debian/control の Descripton とかあんまりいじっていない適当なやつだけど、欲しい人はどうぞ。apt-line はこんな感じで。 deb http://odz.sakura.ne.jp/debian/ gutsy ma... 続きを読む
automakeであるオブジェクトだけフラグを変える方法 開発メモ 例えばSennaでは、nfkc.cというソースの最適化にかなりの時間がかかる。 そこだけ-O0などにするとコンパイル時間が早くなる。 んで、そういうやり方を見つけたのでメモ。 http://sources.redhat.com... 続きを読む