タグ

googleと数学に関するtorutoのブックマーク (3)

  • 検索の数理 - PukiWiki Plus!

    PageRank (ページランク) http://ja.wikipedia.org/wiki/PageRank ページ重要度の自動判定技術 PageRank は、 「多くの良質なページからリンクされているページは、やはり良質なページである」 という再帰的な関係をもとに、全てのページの重要度を判定したものである。 ページランクは、WWW検索エンジンの一つであるグーグルが採用している、ウェブページの重要性を測るアルゴリズム。 グーグル社の商標(PageRank™)でもある。 グーグル社が提供するGoogle ツールバー は、このアルゴリズムによる各ページの評価点を視覚的に表示することができる。 ランクの高いページとは 被リンク数 (単純な意味での人気度の指標) お勧め度の高いページからのリンクかどうか (裏付けのある人気かどうかの指標) リンク元ページでのリンク数 (選び抜かれた人気かどう

  • Bayesian Sets - mots quotidiens.

    Bayesian Sets (Ghahramani and Heller, NIPS 2005)は Google Sets と同じようなことをベイズ的に行うアルゴリズムです。 いくつかアイテムを入れると, それを「補完する」ようなアイテムを 返してくれます。 これは NIPS の accepted papers が出た去年の8月から気になっていて, 会議ではオーラルの発表もあって大体のやっていることはわかった ものの, 何と(会議の時も!)論文がなく, 直接Hellerに連絡して もらえるように頼んでいたところ, Online proceedings の締切りがあった 時に連絡があって, 読めるようになりました。(リンクは下のページ参照) 岡野原君に先に 紹介 されてしまいましたが, 以下は, 岡野原君が書いていない話。 Bayesian Sets は, アイテム集合 D に対して,

  • PRoxy Diary(2006-09-16) - Bayesian Sets

    _ [コンピュータ] Bayesian Sets何はともあれ一番目立つところにリンクをば。 ここのところちょっと時間が取れたので、以前から気になっていたBayesian Setsを実装してみました。Bayesian Setsは、ある単語を入力すると、それと関係が深い単語を推測して返してくれるというものです。Google Setsというサービスを聞いたことがある方もおられるかもしれませんが、やりたいことはあれと同じです。理論的な話に興味がある場合はここを参照するか、元論文に当たってください。 論文で「高速」と紹介されているだけあって、Wikipediaから17万文書を使って学習させたにも関わらず結構な速度で動いてくれています。辞書に登録されている単語数も44万と豊富。これだけのものを現実的な時間で捌いているというだけでも、かなり驚きです。無理やりアドホックに処理を端折って計算量を減らしている

  • 1