タグ

sedueに関するtfukuiのブックマーク (3)

  • SSD向け全文検索エンジン - 純粋関数型雑記帳

    ここのところ私がメインでかかわっていた検索エンジンがリリースされました。 こちらに紹介があります。 http://d.hatena.ne.jp/kzk/20090310 デモとしてWikipediaの全言語(記事が少ない言語は省かれているかも)の全記事 約50GBからの検索を1台のPCで行うものが公開されています。 よかったら試してみてください。 http://demo.sedue.org/wikipediasearch/ 下の方でいくつか数字を出していますが、 正確に計ったわけではないので参考程度にしてもらえると。 ちょこっと宣伝 ボックスに単語を入れると検索できます。 一応、全言語で検索するデモなので、各言語での検索は 全言語の検索結果をフィルタしているだけです。 単語の列を入れると、AND検索できます。 検索速度のデモなので、結果のキャッシュなどはしていません。 すべてのクエリについ

    SSD向け全文検索エンジン - 純粋関数型雑記帳
  • Inside はてなブックマーク全文検索: TokyoCabinet と TokyoTyrant で高速化・並列化 - 武蔵野日記

    遅ればせながら kzk くんの はてなブックマーク全文検索機能の裏側をメモ。 すごくいいコラボレーションだなと思いつつ、ふむふむと思ったのは以下の部分。 当初はそのままSedueをインストールすれば終わるんじゃねぐらいに思っていたのですが、そう甘くも行きませんでした。 一番問題となったのは登録時のパフォーマンス。Sedueでは今まで適当に文を1文章1ファイルで格納していたのですが、バッチで全文章を登録するとなるとこれでは遅すぎたので、TokyoCabinetを使用して文を保存する事にしました。 APIが簡単 4G以上のデータも扱える スレッドセーフ mixiでの高負荷運用実績が有る な辺りが決め手でした。これで劇的に速度が改善し、色々と作業が進め安くなりました。 (中略) 開発方法については、Sedueではランキング関数の部分はプラグイン(動的ライブラリ)の形になっていて、サーバーを走

    Inside はてなブックマーク全文検索: TokyoCabinet と TokyoTyrant で高速化・並列化 - 武蔵野日記
  • はてなブックマーク全文検索機能の裏側

    そろそろ落ち着いて来たころ合いなので、はてなブックマーク全文検索機能の裏側について書いてみることにします。 PFI側は、8月ぐらいからバイトに来てもらっているid:nobu-qと、id:kzkの2人がメインになって進めました(参考: 制作スタッフ)。数学的な所は他のメンバーに色々と助言をしてもらいました。 はてな側は主にid:naoyaさんを中心に、こちらの希望や要求を聞いて頂きました。開発期間は大体1〜2か月ぐらいで、9月の上旬に一度id:naoyaさんにオフィスに来て頂いて合宿をしました。その他の開発はSkypeのチャットで連絡を取りながら進めてました。インフラ面ではid:stanakaさん、契約面ではid:jkondoさん、id:kossyさんにお世話になりました。 全文検索エンジンSedue 今回の検索エンジンはSedue(セデュー)という製品をベースにして構築しています。Sedu

    はてなブックマーク全文検索機能の裏側
  • 1