タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

全文検索に関するhskkskのブックマーク (2)

  • 全文検索の機能 - 株式会社プリファードインフラストラクチャー

    Sedueでは、「転置インデックス」「N-Gram」「接尾辞配列」「圧縮接尾辞配列」の4つのインデックス方式をサポートしています。それぞれの方式には速度・精度等の面で様々なトレードオフが有りますが、Sedueではこれらの方式を柔軟に切り替えられるため、ニーズに合った検索システムを柔軟に構築する事が可能です。 特に接尾辞配列方式と、高速・大容量ストレージとして注目を集めるSSD (Solid State Drive)と組み合わせることで、今までであれば数10台のサーバーが必要とされたような大規模な検索システム(数十GB~)を、1台のサーバーで実現する事が出来ます。 弊社では、PCサーバ1台でWikipedia全文章(全言語版、2,200万文章、約50GB)を 高速に検索するデモサイトを公開しております。 Sedueでは、文章の追加・更新・削除を全て即時に行う事が可能です。これは1種類のインデ

  • 転置インデックス - Wikipedia

    転置インデックス(てんちインデックス、Inverted index)とは、全文検索を行う対象となる文書群から単語の位置情報を格納するための索引構造をいう。転置索引、転置ファイル、逆引き索引などとも呼ばれる。 情報処理テクノロジにおける転置インデックスとは、単語や数字といった内容から、それが含まれているデータベースやドキュメント群へのマッピングを保持するという、インデックス型データ構造である。ドキュメント群へのマッピングの場合、検索エンジンが実現される。転置インデックスファイルは、インデックスというよりはデータベースと呼んだほうがふさわしい場合もある。また、検索キーが単語(文字列)であり、連想配列の値が位置情報である場合、ハッシュテーブルの形態を取ることもある。 転置インデックスには大きく分けて2通りの手法がある。レコード単位転置インデックス(record level inverted in

  • 1