検索技術においてAND検索、つまり二つの単語を指定して、それが両方出現している文書数の推定を高速に行うのは難しい問題です。 問題を正しく書くと単語w_xが出ている文書番号(x1,x2,x3,..,xn)とw_yが出ている文書番号(y1,y2,y3,...,ym)が与えられたら | {(i,j)|x_i = y_j} | の数を求める問題です。 これは前もって全通り求めて保存しておくにも単語種類数の二乗のオーダー分必要なのでできません。 これは機械学習でも特徴関数が0/1の値しかとらないとき、二つの要素の特徴ベクトルの内積を求める問題と同じで、またデータベースでもJOINの順番を決めるときにでてくる問題です。 普通は全体の文書からサンプルをとって、その中で数えてみて、それを元のサイズにスケールさせることをします。例えば全体文書1億件の中から文書1000件だけとってきて、その中でw_xとw_y
情報検索入門シリーズ。 検索のための文書のスコア付け手法として最も基本的なtf-idfの、 idf(inverse document frequency)の部分の考案者がKaren Sparck Jonesであることについては 以前述べた。ではtf(term frequency)の考案者は? 答えはベクトル空間モデルの発明者Gerard Salton、ではなくて、H.P. Luhnだろう。 ちょうど半世紀前に書かれた文献[1]にこんな文が出てくる。 There is also the probability that the more frequently a notion and combination of notions occur, the more importance the author attaches to them as reflecting the essen
To post social content, you must have a display name. The page will refresh upon submission. Any pending input will be lost. Display Name * Page not available This page may have been moved, removed, or the link may be incorrect. We suggest you use the search function at the top right of this page or click 'Elsevier Support Center' to visit the homepage.
The document name you requested (/Publications/JASIS/jasis.html) could not be found on this server. However, we found documents with names similar to the one you requested.Available documents: /Publications/JASIS/jasis.899 (common basename) /Publications/JASIS/jasis.gif (common basename) Apache/2.0.52 (CentOS) Server at www.asis.org Port 80
社団法人 電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS 信学技報 TECHNICAL REPORT OF IEICE. 類似性に基づいたウェブページ選択インタフェース 松本 裕二† 馬野 元秀† 瀬田 和久† † 大阪府立大学 大学院 理学系研究科 情報数理科学専攻 〒 599–8531 堺市学園町 1–1 E-mail: †matumoto@marron.cias.osakafu-u.ac.jp あらまし インターネットの検索エンジンが返すページは膨大で重複が多い.普通はキーワードを追加して検索を絞 り込むが,適切な検索質問を作成するのは難しい.そこで,我々はユーザが指定した項目 (ページ) との類似性に基づ いて,検索結果の各項目 (ページ) を一覧から削除したり残したりす
Web Adam Jatowt 606-8501 E-mail: {yanbe,nakamura,adam,tanaka}@dl.kuis.kyoto-u.ac.jp Web Web Page PageRank 2 Web PageRank 2 Utilizing Social Bookmarks to Enhance Ranking in Web Search Yusuke Yanbe Satoshi Nakamura Adam Jatowt and Katsumi Tanaka Department of Social Informatics, Graduate School of Informatics, Kyoto University Yoshida-Honmachi, Sakyo, Kyoto 606-8501 Japan E-mail: {yanbe, nakamura, a
Information Retrieval in Folksonomies: Search and Ranking Andreas Hotho,1 Robert Jäschke,1,2 Christoph Schmitz,1 Gerd Stumme1,2 1 Knowledge & Data Engineering Group, Department of Mathematics and Computer Science, University of Kassel, Wilhelmshöher Allee 73, D–34121 Kassel, Germany http://www.kde.cs.uni-kassel.de 2 Research Center L3S, Expo Plaza 1, D–30539 Hannover, Germany http://www.l3s.de A
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く