エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
CSA vs FM-index - DO++
今年もCopressed Suffix Arrays (CSA) とFM-indexに関する論文がたくさんでている。話は理論的なものか... 今年もCopressed Suffix Arrays (CSA) とFM-indexに関する論文がたくさんでている。話は理論的なものからより実用面での話しに変わってきている。 CSA、FM-indexどちらもBWTをベースにしていて、nバイトをインデクシングするのに4nバイトかかるSAをそのまま保存するかわりにCSAはψ、Fm-indexはBWT後のテキストを圧縮した形(rank操作付き)で保存する。FM-indexはψ^{-1}の情報(のようなもの)を保持しているので対称なindexともいえる。 今後は圧縮率ではなく検索速度の方が重要になってくると思われる。今はまだ圧縮なしSAよりはるかに遅い(実装やパラメーターにもよるけど、まだ十倍程度の差がある)。パターン長を変えたときの比較がよくあるが、圧縮Hgt配列をCSAに組み合わせての検索ってまだないのだろうか。そうするとパターン長に依存せず
2013/03/01 リンク