タグ

検索エンジンに関するnihohiのブックマーク (6)

  • 岡部 正幸 ( Masayuki Okabe ) | 国立大学法人 豊橋技術科学大学 

  • Luceneスコアリングの大雑把な説明 | 関口宏司のLuceneブログ

    一定期間更新がないため広告を表示しています

    Luceneスコアリングの大雑把な説明 | 関口宏司のLuceneブログ
    nihohi
    nihohi 2012/03/19
    スコアについて概要
  • 第1回 エンタープライズサーチと6つの罠

    エンタープライズサーチの導入を検討する段階でいくつかの課題(陥りやすい罠)が出てきます。これらの課題を解決しなければ、エンタープライズサーチを導入しても、効果的な情報検索の実現という最終目標は達成できないと考えていいでしょう。 最近のテレビCM いまやテレビで「詳しくは○○○で検索!」といった検索窓を表示する手法を使ったCMを見ない日はありません。これは、一般家庭で携帯電話やパソコンを使った検索が日常的に行われていることを表しています。 このように、「欲しい情報を検索という手段ですぐ得られる」というのは便利この上ありません。CMで流れた○○○というキーワードを検索ボックスに入れて検索ボタンを押せば、インターネット上に数多く存在するWebサイトの中から見たい商品や知りたい場所の情報がすぐに得られます。同じようにすれば企業の中でも欲しい情報(および情報源)が検索して得られて便利だ、と考えてもお

    第1回 エンタープライズサーチと6つの罠
    nihohi
    nihohi 2012/03/19
    企業内検索についての注意点について
  • 検索エンジンの常識をApache Solrで身につける

    検索エンジンの常識をApache Solrで身につける:ビッグデータ処理の常識をJavaで身につける(1)(2/4 ページ) 【2】言語同定器 検索エンジンで複数の言語からなる文書集合のインデックスを生成する際、入力文書の記述言語によって処理が異なることがあります。 例えば、日語文書では単語の区切りがないため、トークナイザが文中に含まれる単語を確率的に推定して単語を切り出してあげる必要があります。一方で、英語の文は単語の区切りが自明であるため、トークナイザが行う処理はほとんどありません。このように、入力文書の記述言語が複数存在する状況では、入力文書の記述言語によって利用するトークナイザなどのコンポーネントを変更する必要があります。 上記のように入力言語によって処理内容を変えるためには、そもそも入力クエリや文書が、どの言語で記述されているのかを同定する必要があります。「言語同定器」というコ

    検索エンジンの常識をApache Solrで身につける
  • オープンソースの全文検索システムの速度性能比較(PDF)

    オープンソースの全文検索システムの速度性能比較 早坂 良太 林 貴宏 電気通信大学 尾内 理紀夫 1. はじめに 3. 実験 近年,日語を扱うことができるオープンソース の全文検索システムの開発が盛んになっている.そ れらのシステムを使用することで,デスクトップ検 索などの個人用途から大規模な検索エンジンまで, 様々な要求を満たすことが可能となる.いくつかの 全文検索システムの中から自分の求めるシステムを 選択する場合,速度性能は重要な指針となりうるが, どのシステムが高速であるかは実際に動作させてみ なくては明らかではない. 稿 で は Namazu(*1) , Lucene(*2) , Senna(*3) , Estraier(*4),Hyper Estraier(*5)の 5 つのオープンソース の全文検索システムについてインデクシング速度・ 検索速度を比較した結果

    nihohi
    nihohi 2012/02/08
    インデクシング時間の測定結果、比較について。10^6件程度で10^5sec程度
  • ADIPATISLOT: Situs Resmi Permainan Online - Aman, Terpercaya, dan Berkualitas

    ADIPATISLOT menawarkan berbagai macam permainan online berkualitas tinggi. Sebagai situs terpercaya dan berlisensi resmi, ADIPATISLOT menjadi agen pilihan yang menjamin kepuasan pemain dengan proses deposit cepat dan penarikan dana yang efisien, serta selalu menjunjung tinggi keamanan dan kejujuran.

    nihohi
    nihohi 2012/02/08
    Solrのinstall方法 on ubuntu 10.10。後でやってみる。
  • 1