タグ

2009年2月25日のブックマーク (2件)

  • Microsoft Word - Lucene_WhitePaper_20080724.doc

    Scoring Technology of Lucene Lucene のスコア計算 2008 年 7 月 11 日 サイバービーンズ株式会社 千葉順二 はじめに 書は「Apache Lucene1 」(以下、Lucene) のスコア計算を解説するものである。情報検 索に関する前提知識無しに読み進める内容を 心がけたので、書により、Lucene のスコア 計算の仕組みをご理解頂ければ幸いである。 合率7 がある。再現率は検索漏れの少なさを 示す尺度であり、適合率は検索ノイズの少な さを示す尺度である。再現率と適合率とはトレ ードオフの関係にあり、多くの検索結果を返す ようにすると、それに伴いノイズに悩まされる。 検 索サイトの利用者に対してリサーチを行っ た結果、検索結果画面を3ページまでしか見 ない利用者が多いという報告がある8。適合率 を向上する、すなわち検索ノイズを完全に

    Hayato
    Hayato 2009/02/25
    Luceneのスコア計算
  • hadoopとかsolrとかの実験 - Solrのインストール - myfinder -redMine-

    何はともあれ動かしてみないとどんなものかわかりません。 JavaとTomcatのインストール すでにやってあるものとします。 JavaはどこでもいいのでPATH通しておいてください。 Tomcatは/usr/local/apache-tomcat-5.5にインストールしたものとします。 solrの初期設定 solrはJavaで書かれてるので、JettyやらTomcatの上で動きます。 アーカイブは適当にftpサイトから持ってくる 超参考サイト 超参考サイト 配備 ~/apache-solr-1.3.0/dist/apache-solr-1.3.0.warを、solr.warとしてTOMCAT_HOME/webappsに配置。 TOMCAT_HOME/conf/Catalina/localhost/solr.xmlを作成 <Context docBase="solr" debug="0" c

    Hayato
    Hayato 2009/02/25
    solrの検索クエリが文字化けした件の対応方法