タグ

Lempel-Zivに関するtsupoのブックマーク (1)

  • LZ法再び - DO++

    可逆データ圧縮としてはgzipやlha, pngなどダントツで使われているLZ法(Lemple Ziv法)ですが、他のデータ圧縮法(BWT法、PPM法、CM法)に比べ圧縮率が低いということで研究の対象としてはあまり注目をあびていませんでした。ところが次の論文で真面目にやれば圧縮率は非常に高くなる可能性があり、BWT法とかそれを超える可能性があることが示されています。。 "On the bit-complexity of Lempel-Ziv compression", SODA 2009, P. Ferragina, et. al. [pdf] まず、LZ法についておさらいですが、基的にはデータを前から順番に見ていったときに、既に出現した文字列がもう一度出現(マッチング)したら、その文字列を前回出現した(相対)位置と長さのペア(pos, len)で置き換えることで圧縮する方法です。データ

    LZ法再び - DO++
    tsupo
    tsupo 2008/10/22
    真面目に最長&最右一致を全過去の文脈から探すと圧縮率は非常に高くなる / 数文字スキップしたらもっと長いマッチングがあって全体を小さくできる可能性 / 最長&最右一致よりも更に数%圧縮率を向上可能
  • 1