Query by Category Find pages that referrence concepts in a category. For example, use "category: american-presidents" to search for pages that talk about Presidents of the USA. More Information
米Yahooは自社検索広告事業を強化するため、自社技術を土台にカスタム検索エンジンを構築できるプロジェクト「Yahoo! Search BOSS(Build Your Own Search Service)」を開始した。 Yahooは7月10日夜にBOSSのベータテストを開始する。BOSSを利用することで、検索ボックス付きの独立したウェブサイトを構築できる。ユーザーのクエリをBOSSに渡し、Yahooの検索エンジンが返す結果を処理し、それを表示できる。 BOSSは、外部開発者による検索イノベーションを可能にし、その成果から利益を共有する仕組みといえる。Yahooは、自社技術を外部開発者に提供することで、インターネットで重要な部分になろうとする取り組み「Yahoo Open Strategy」を発表しており、これを具現化したものでもある。 Yahooの検索部門で検索戦略の責任者を務めるPra
Yahoo! Search BOSS が出たので試してみました 2008-07-11-3 [Programming] 米Yahoo!のBOSSが出ました。 なんのことやら、という方は下記のニュースなどで。 ■米Yahoo!、検索技術をオープンにする「BOSS」発表 http://enterprise.watch.impress.co.jp/cda/foreign/2008/07/11/13395.html ■米ヤフー、オープン検索プラットフォーム「Yahoo! Search BOSS」を発表 http://japan.cnet.com/marketing/story/0,3800080523,20376947,00.htm ■Yahoo!、独自の検索サービス作れる「Search BOSS」を公開 http://www.itmedia.co.jp/news/articles/0807/11/
2008/05/15 インターネットの検索でエポックメーキングな出来事は2度しか起こっていない。1994年にジェリー・ヤン氏らが立ち上げたヤフーがインターネットに検索をもたらしたときと、1998年にラリー・ペイジ氏らがグーグルを立ち上げ、Webページの重要度を示す「PageRank」という概念を導入したときだ。検索連動広告の発明もビジネス的には大きなステップだったが、使い勝手の向上というユーザー視点での転回点は2つだけだ。いま、ベンチャー企業の米Powersetが注目を集め、3つ目のイノベーションを起こすかどうかが注目されている。 ネット検索の歴史:数から順位への転換 Powersetが解決しようとしている問題を明確にするために、インターネットの検索エンジンの歴史を少しだけ振り返ってみよう。 グーグルが登場する以前、各検索サイトは、自分たちがいかに多くのWebページをクロールし、検索に対し
Googleには「ウェブマスター ツール」というのがあり、自分のサイトのどこが更新されたかというのをサイトマップ(RSSで代用可能)によって通知し、Googleの検索クローラー(ページを取得して解析するプログラム)用のボットに来てもらうという便利な機能があるのですが、それと同じものがついに日本のYahoo!にも登場しました。その名は「Yahoo!検索 サイトエクスプローラー」、まだベータ版ですが、海外では2005年9月にリリースされており、遅れること実に2年半近く、やっと日本でも使えるようになったというわけ。 機能的にはかなり優秀で、インデックスされてYahoo!の検索結果として登録されている自分のサイトのページを確認してTSVまたはXML形式で最大1000件ほど出力したり、逆にインデックスされているページを非表示(Yahoo!の検索結果に出ない)にすることもできます。また、スパムサイトが
最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めの本です。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く