タグ

検索エンジンに関するfevnirのブックマーク (5)

  • 新検索エンジン「Cuil」が始動--グーグルの対抗馬となるか?

    大規模な新しい検索エンジン「Cuil」が米国時間7月28日に始動した。スタンフォード大学のTom Costello教授とGoogleの元検索アーキテクトであるAnna Patterson氏の夫がチームを組んでCuilを開発し、運営も行う。Googleの主力商品である検索エンジンよりも、あらゆる点で規模が大きく高速で精度が高いというのがうたい文句だ。 CuilとGoogleのもっとも大きな違いは、ランキングシステムだ。Googleのように外部リンクに基づいてページに優先順位を付ける(「Pagerank」)のではなく、Cuilはウェブページのコンテンツを分析して、検索クエリとの関連性を推測する。最近Microsoftに買収されたPowerSetのようなセマンティック(自然言語)検索エンジンなのか尋ねたところ、Costello教授は気色ばんだ。Costello教授は、Cuilの検索は「コンテキ

    新検索エンジン「Cuil」が始動--グーグルの対抗馬となるか?
  • 1日で作る全文検索エンジン - Building a full-text search engine in "ONE" day - - とあるはてな社員の日記

    最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めのです。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン

  • 連載:検索エンジンを作る|gihyo.jp … 技術評論社

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    連載:検索エンジンを作る|gihyo.jp … 技術評論社
    fevnir
    fevnir 2008/05/04
    既存の検索エンジンの機能にあきたらず,自ら検索エンジン作りに乗り出した技術者の貴重な体験記
  • 第4回 形態素解析のしくみ | gihyo.jp

    ソフトウェア的な索引では見出し語に対して、その見出し語が使われている文書(ファイル名、文書ID等)のリストを保存します。検索時は索引から見出し語を見つけ、その見出し語が使われている文書のリストを取得するだけなので、高速に検索が行えます。 全文照合方式と索引方式には、それぞれメリットとデメリットがあります。全文照合方式は、検索のたびに対象のテキストデータをメモリ上に読み込んで照合処理を行うため、大量の検索対象の場合、どうしても検索時間がかかるという欠点があります。 索引方式は、高速に検索が行える反面、あらかじめ索引を作成しておかなければなりません。索引の作成処理は、かなり負荷の高い処理になってしまいます。 このため、全文照合方式と索引方式には、それぞれ向き、不向きがあります。利用する場面に応じて使い分けるのがポイントです。検索対象が少量で検索回数も少ないなら全文照合方式、検索対象が大量で頻繁

    第4回 形態素解析のしくみ | gihyo.jp
  • 検索エンジン相関図 2008年1月版|αSEO(アルファSEO)

    検索エンジン相関図 2008年1月版。検索連動型広告の掲載パートナー、ロボット型検索エンジンの主要な提携先等をまとめています。今月からPCとモバイルのコンテンツ連動型広告相関図を追加しました。 PC 検索エンジン 主な動き 今回はロボット型、ディレクトリ型、検索連動型ともに大きな変更はありません。ただし、ウェブ検索の2強、Yahoo!Googleは検索利用者の意図を汲んだ機能の改良を行っています。 Yahoo!は検索キーワードがYahoo!ニュース内の記事と合致し、かつユーザーがリアルタイム情報を求めていると判断される場合にウェブ検索結果にニュース記事へのリンクを表示するようになっています。また、Googleは地域系キーワードと組み合わせて検索した時に、ウェブ検索結果上に地図と地域情報、口コミへのリンクを表示しています。特にGoogleはユーザーの意図に適したデジタルコンテンツを表示する

    検索エンジン相関図 2008年1月版|αSEO(アルファSEO)
  • 1