タグ

検索エンジンとIRに関するsleepy_yoshiのブックマーク (3)

  • 特許から判断する検索エンジンのアルゴリズム要素×26

    検索エンジン会社が申請・取得した特許・論文を細かく分析して情報を公開することで有名なSEO By The Seaというブログがあります。 サイトオーナーはBill Slawski(ビル・スラウスキ/スロースキ)氏という人物で、Patent Guru(特許の達人)とも呼ばれています。 彼が最近受けたインタビューのなかで、特許の研究から読み解いた検索エンジンがランキングを決める際に考慮していると思われるアルゴリズムの要素をリストアップしていたので紹介します。 まずアルゴリズム要素を3つのタイプに分類しています。 リンクに基づく要素 コンテンツに基づく要素 ユーザーの行動に基づく要素 それぞれに具体的にどんな要素があるのか訳します。 1. リンクに基づく要素 リンクの数と重要性以外に次のような要素が考えられる。 リンクの年齢 リンクの増減の頻度 リンク切れやリダイレクトリンクの数 リンクのアンカ

    特許から判断する検索エンジンのアルゴリズム要素×26
  • 簡単なWebサーチエンジンの作り方 - Imagine with 加藤和彦

    筑波大学は3学期制で,12月1日から3学期が始まりました.3学期には私が担当している学類生(普通の大学の学部生)3年生向けの実験があります.約3ヶ月を掛けて,ほどほどの規模のプログラム作成を行います.私が作り,担当しているプログラム実験は「Webサーチエンジン」といいまして,テキストはこちらに公開しています. この実験,結構,自信作なんです.Javaの基的なプログラミングができることだけを仮定して,漏れのない全文検索を行うWebサーエンジンを作ります.Webデータ収集を自動的に行うクローラー付き.Googleのようなページランキング機能はありませんが,一応,サーチエンジンの基機能を備えます.自慢は,このテキストが実質A4で印刷して2ページくらいであること.数学の小問を解いていくように,順番に小問を解いていくと,最後にはWebサーチエンジンができます. ミソはサフィックス・アレイ(suf

    簡単なWebサーチエンジンの作り方 - Imagine with 加藤和彦
  • セミナー資料公開「Extreme Search! 次世代検索エンジンSedueが実現する驚異のパフォーマンス」

    2009年4月8日(水) 13:00〜15:30に開催されましたPreferred Infrastructureによる製品紹介セミナーの発表資料です。

  • 1