タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

irに関するnhayatoのブックマーク (8)

  • 検索エンジンはいかにして動くのか? 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    検索エンジンはいかにして動くのか? 記事一覧 | gihyo.jp
    nhayato
    nhayato 2014/10/07
  • Elastic — The Search AI Company

    Search and analytics, data ingestion, and visualization – all at your fingertips.

    Elastic — The Search AI Company
    nhayato
    nhayato 2013/09/25
  • Real World Recommdnder - 現実世界の推薦システムにおける、精度と速度以外の話 -

    自己紹介 d:id:gnarl twitter:todesking いちおう情報系 興味 プログラミング言語処理系 ソフトウェア・アーキテクチャ(オブジェクト指向設計とか) 機械学習(ニワカ) 推薦エンジンを作ってるチームに所属してます 最近の仕事: javaでニュース記事の特徴語を解析して云々 ruby+sinatraでなんかつくる仕事 アジェンダ(1) 推薦システムとはなにか 推薦システムの種類 コンテンツベース、行動ベース ユーザ-アイテム、アイテム-アイテム モデルベース、メモリベース この辺の話は皆さんのほうが専門家ですね…… 省略します アジェンダ(2) 推薦システムの精度をはかる MAE/RMSE Precision, Recall 推薦システムの抱える問題点 スパースネスの問題 コールドスタートの問題 この辺の話を長々とすると会場の研究者にしらけた顔をされる…… 省略します

  • true positive, false positive, true negative, false negative

    true positive, false positive, true negative, false negative 2008-06-22-2 [IIR] 情報検索や機械学習や自動分類なんかでよく出てくるんだけど、 未だに頭が大混乱してしまう true positive, false positive, true negative, false negative の話題。 「Introduction to Information Retrieval」の 第8章[2008-06-22-1]に出てきます。 まずは、 8.3 の表: RelevantNonrelevantRetrievedtrue positives(tp)false positives(fp)Not retrievedfalse negatives(fn)true negatives(tn) 輪講参加者から覚え方を教えて頂

    true positive, false positive, true negative, false negative
    nhayato
    nhayato 2012/11/17
  • 検索における適合率 (Precision) と再現率 (Recall)

    検索における適合率 (Precision) と再現率 (Recall) 2008-01-17-1 [IIR] 「Introduction to Information Retrieval」[1] の輪講の第一回[2008-01-12-1]でちらっと話しましたが、第一章の 1.1 に Precision と Recall の説明があります(第八章でも出てきます)。 若干混乱しやすくややこしい話なので、ここで改めて解説します。 § Precision (適合率) とは、 全検索結果に対しての、 検索要求 (information need) を満たす検索結果の割合です。 例えば、 「MacBook Air の重量を知りたい」という検索要求を満たすために検索キー「MacBook Air 重さ」でウェブ検索した結果100件のうち、検索要求を満たす(重さが分かる)のが85件だとすると、 Precis

    検索における適合率 (Precision) と再現率 (Recall)
    nhayato
    nhayato 2012/11/17
  • 語の共起情報を用いたWeb検索

    概要 現在、Web上の莫大な情報の中から、ユーザが必要な情報を 得る手段として検索エンジンが広く用いられている。 各検索エンジンでは、検索結果を順位付けし、 一般的に評価の高いWebページを検索結果の上位と することで効率化を図っている。 しかし、有用であるということは主観的であるため、 一般的に評価の高いページが誰にでも有用であるとは限らない。 研究では、ユーザが入力した検索キーワードと Webページ内に含まれる語との共起性を用いて、 Webページを評価し、さらにユーザからのフィードバックを 得ることで、各ユーザの要求により適合した結果を提示する 検索方法を提案する。 従来手法 重要語抽出の従来手法 多くの自然言語文書処理において用いられている 代表的な手法に tfidf(Term Frequency-Inverse Document Frequency)法 [1][2]がある。 対象

    nhayato
    nhayato 2012/11/01
  • Mean reciprocal rank - Wikipedia

    This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed. Find sources: "Mean reciprocal rank" – news · newspapers · books · scholar · JSTOR (June 2007) (Learn how and when to remove this message) The mean reciprocal rank is a statistic measure for evaluating any process that

    nhayato
    nhayato 2012/11/01
  • HITS, 主成分分析, SVD - naoyaのはてなダイアリー

    ウェブグラフのリンク解析によるページの評価と言えば PageRank が著名ですが、もうひとつ Jon Kleinberg による HITS (Hyperlink-induced topic search)も有名です。最初の論文 Authoritative Sources in a Hyperlinked Environment は 1999年です。IIR の 21章で、この PageRank と HITS についての解説がありました。 HITS HITS はウェブページの評価に二つの軸を用います。一つが authority スコア、もう一つが hub スコアです。 例えば「Perl の情報が欲しい」という検索要求に対しては CPAN や 開発者である Larry Wall のホームページなどが重要度の高いページかと思います。これらのページは「Perl に関して信頼できる情報源」ということ

    HITS, 主成分分析, SVD - naoyaのはてなダイアリー
    nhayato
    nhayato 2012/11/01
  • 1