タグ

2008年5月14日のブックマーク (2件)

  • 1日で作る全文検索エンジン - Building a full-text search engine in "ONE" day - - とあるはてな社員の日記

    最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めのです。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン

  • サイトエクスプローラー(サイト管理者向けツール) - Yahoo!検索

    Yahoo!検索が提供する、ウェブマスター向けツール。Yahoo! JAPAN IDと一緒に使うことで、自分の管理しているサイトのフィードをYST(Yahoo! Search Technology)のクローラーに送信したり、動的URLの設定をしたりすることができる。指定するサイトのインデックス済みURL検索や、被リンク元URL検索もできる。管理サイトを追加 Yahoo! JAPAN IDでログインすると、管理サイトとして、サイトを追加できます。また、「管理サイト」に追加したサイトが認証されると、次の操作ができます。 あなたのサイトのフィードURLをYahoo!の検索エンジン(YST=Yahoo! Search Technology)に送信する。 Yahoo!の検索エンジンにインデックスされているあなたのサイトのページを、Yahoo!検索の検索結果で非表示にする。 コンテンツに影響を