(WO/2007/063328) INFORMATION RETRIEVAL SYSTEM AND METHOD USING A BAYESIAN ALGORITHM BASED ON PROBABILISTIC SIMILARITY SCORES (WO/2007/063328) INFORMATION RETRIEVAL SYSTEM AND METHOD USING A BAYESIAN ALGORITHM BASED ON PROBABILISTIC SIMILARITY... 続きを読む
別にブログに書いてもしょうがないかなーと思っていたのですが、同じような目に遭う方がいるかもしれないのでちょろっとだけ書いておきます。先日Stupaという関連文書検索システムを公開したのですが、その中で使用していたBayesian Setsというアルゴリズムが既... 続きを読む
都会よりも田舎が好きなfujisawaです。Bayesian Setsというアルゴリズムを使って、関連する文書を高速・高精度に検索できるシステムを作成しましたので、そのご紹介をさせていただきます。 Bayesian Setsとは Bayesian Setsはいくつかアイテムを入力すると、そ... 続きを読む
前回のエントリでBayesian Setsを試してみたのですが、その時に書いたコードをAlgorithm::BayesianSetsというモジュールにまとめて、CPANにアップしました。生まれて初めてのCPANアップです。Algorithm::BayesianSets - search.cpan.orgすごいちっちゃいモジュ... 続きを読む
この前YAPC Asia 2009に参加してきたのですが、そこで「はてなブックマークのシステムについて」の発表の中で、「はてブの関連エントリはBayesian Setsを使って計算されている」という話を聞いてBayesian Setsに俄然興味が湧いてきました。Bayesian Setsは以前... 続きを読む
Bayseian Setが面白そうだったので、これを使ってはてなブックマークの最新人気エントリをグループ分けするプログラムを書いてみました。ブックマークしたユーザーを属性と見て分類します。起動するとはてなブックマークから最新エントリを取得して、HTMLを標準... 続きを読む
Bayesian Setとは集合D_Cが与えられたとき、そこから「類推」して、元の集合C⊃D_Cに入る元xを(「自信」の度合いを表す数値つきで)求めるというもの。ただし、D_Cの元やxは特徴データ{c_i}をもっているとする。で、原論文を読むとΓ関数がずらずらでてきておどろ... 続きを読む
Bayesian Sets, Z. Ghahramani, K. A. Heller, NIPS 2005 [paper] が面白い Google Setsにインスパイヤされたと書かれている。これが扱っている問題は、複数のクエリを与えた時に、それが含まれているだろうクラス/コンセプト/クラスター集合の残りの要素を返す... 続きを読む