タグ

algorithmとppmに関するmogwaingのブックマーク (2)

  • SP partial decodable compression

    SPはStatic PPMを用いたデータ圧縮プログラムです。 従来のデータ圧縮法と比較し次の特徴があります。 全体を復元せずに任意の部分のみを復元可能 大きいファイルに対して圧縮率はbzipと同程度。小さいファイルではgzipと同程度。 復元処理の計算量、領域量は従来の高圧縮率の手法(BWTやPPM)と比較して小さい SPは研究目的に開発されたため、一般的な圧縮ソフトとしての利用は想定していません。そのため、圧縮したファイルが復元できない可能性や最悪の場合ファイルが消去される可能性があります。決して研究目的以外で利用しないでください。プログラム(SP)を利用したことにより生じたいかなる損害に対しても作者は責任を負いません。ご了承ください。 また、ソースコードをコンパイルし、動作させた結果に対しても作者は一切責任負いません。ソースコードは自由に改変、利用してくださって構いません。商用利用

    mogwaing
    mogwaing 2009/05/20
    static ppm
  • PPM

    PPMとは? PPMというのは、既出したデータから次の文字を予測して、確率を変化させる ことにより圧縮するものである。 例えば abcdabcdabcdabc○ と来て○に入る文字は何だろうと考えてみたとき、dが出やすいというのは直感的に わかる。そういう場合はdの確率を上げ、他の文字の出現確率を下げる。すると、圧縮 される。たぶんわからないと思うので、詳しく説明します。 確率を上げるとなぜ圧縮率が上がるか? 例えば8種類の文字 a,b,c,d,e,f,g,h があって、それを0と1で表すのならば a:000 b:001 c:010 d:011 e:100 f:101 g:110 h:111 (方法A) とそれぞれに3bit割り振ればよい。つまり一文字に付き3bit使う。 これに対し、もし8つの文字にばらつきがある、つまり出現確率が違う場合には 多く出てくる文字に対

    mogwaing
    mogwaing 2009/05/20
    exclusionの説明がわかりやすすぎる
  • 1