全文検索では検索要求に対し、「漏れなく」「高速」かつ「正確」に結果を返す必要があります。 この前者二つの実現のためにSedueではCompressed Suffix Arrays(CSA)と呼ばれる索引を利用しています。また、「正確」な結果を実現するために形態素解析や文書情報を解析した結果を利用したランキングを利用しています。これらを順に解説していきます。 Compressed Suffix Arrays Sedueは全文検索を実現するのにCompressed Suffix Arrays (CSA)を利用しています。従来の全文検索システムでは前もって辞書などで決めておいた各単語の出現位置を記録した転置ファイル方式、または、全ての長さNの部分文字列の出現位置を記録したn-gram方式が利用されていました。 転置ファイル方式では高速な検索が実現できる一方、検索漏れが生じる恐れがあり、またn-g