タグ

algorithmとtechnologyに関するwebmarksjpのブックマーク (3)

  • 初代Googleのアルゴリズム解説 - GIGAZINE

    いまやネットの世界を左右する強力な検索エンジンとなったGoogle。日ではまだYahoo!の方がはるかに利用者が多いのでさほどではないですが、アルゴリズムの基的な考えが似ているため、同じような結果が出てきます。つまり、既存の検索エンジンのその基礎となった一番最初のGoogleの検索アルゴリズムを理解すれば、検索エンジン対策にも役立つはず。 ということで、初代Googleのアルゴリズムをできるだけわかりやすく解説してみます。既存の他サイトの解説とは違い、きちんとした最初のGoogleの数式に基づいています。 詳細は以下から。The Anatomy of a Search Engine http://www-db.stanford.edu/~backrub/google.html Googleの画期的なランク付けの方法が数式による全自動のページランクというのは聞いたことがあると思いますが、

    初代Googleのアルゴリズム解説 - GIGAZINE
  • 「Googleを支える技術」に載っていない日本語検索エンジンの技術 - nokunoの日記

    Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「下準備があればこその高性能」なわけです。 インデックスを作成するためには、あらかじめWebページの内容を単語に分割する必要があります。英語では単語と単語の間をスペースで区切るため、この作業はさほど難しくありません。しかし日語では、単語の境界はそれほど自明ではないため、日語特有の処理をする必要があります。 日語の文から単語に分解するには、形態素解析を使う場合と、N-gramを使う場合があり、そ

  • マイクロソフトの新技術「SNARF」--人間関係を手がかりにメールを分類

    世界中のネットユーザーが、未読メッセージで溢れる電子メールの受信ボックスに頭を抱えているが、Microsoftの研究者らはあるツールを投入し、この問題の緩和に役立てたいと考えている。 同社は先週、新しい方法で電子メールを整理するユーティリティツールを無償で公開した。このツールのユーザーは、受信したメッセージを着信順だけでなく、送信者との関係の深さによっても並べ替えることができるというものだ。 「SNARF(Social Network And Relationship Finder)」と呼ばれるこのプログラムは、人は自分が大切に思っている相手からのメッセージほど、それに答えを返す傾向が強いという事実にもとづいたアプローチを採用している。 Microsoftの研究者の1人で、SNARFを開発したMarc Smithは、「人は全部のメールに返信するわけではないし、反対に全員から返信が来るわけで

    マイクロソフトの新技術「SNARF」--人間関係を手がかりにメールを分類
  • 1