タグ

圧縮に関するtaka-junのブックマーク (5)

  • XZ Utils の使い方

    矢田 晋 Abstract: XZ Utils は LZMA Utils の後継となるソフトウェアであり,Lempel–Ziv–Markov chain Algorithm(LZMA)の改良版である LZMA2 の実装になっています.圧縮には時間がかかるものの,bzip2 を上回る圧縮率を誇り,高速に伸長できるという利点から,tar に採用されるなど,普及が進んでいます.記事は,C 言語から XZ Utils を利用する方法の解説になっています. はじめに XZ Utils のドキュメントは,公式サイトで配布されているアーカイブに同梱されています.FAQ,開発履歴,圧縮形式の解説は doc/ にあり,ライブラリのマニュアルは,src/liblzma/api/lzma/ にあるヘッダに記述されています.XZ Utils がインストールされている状況では,#include するヘッダは <l

  • libbzip2 の使い方

    矢田 晋 Abstract: libbzip2 は bzip2 で採用されている圧縮アルゴリズムのライブラリです.Burrows-Wheeler Transform (BWT) を用いることが特徴の一つであり,gzip と比較すると,圧縮・伸長には時間がかかるものの,優れた圧縮率を示すことが多くなります.記事は,C 言語から libbzip2 を利用する方法の解説になっています. はじめに libbzip2 のマニュアルは公式サイトで提供されています. http://www.bzip.org/(bzip2 : Home) bzip2, libbzip2 の公式サイトです.ソースコードとマニュアルがあります. libbzip2 では,bz_stream という構造体を用いる低水準インタフェースと,BZFILE という型を用いる高水準インタフェースが用意されています.低水準インタフェースはメ

  • zlib の使い方

    矢田 晋 Abstract: zlib は圧縮アルゴリズムの一種である Deflate のライブラリであり,C#, Haskell, Java, Perl, Python, Ruby など,主要なプログラミング言語では,軒並み使えるように整備されています.圧縮・伸長が高速なこともあり,ディスク領域の有効利用や通信量の削減を目的として,zlib は気軽に利用できます.記事は,C 言語から zlib を利用する方法の解説になっています. はじめに 最新版のマニュアルは公式サイトで提供されています.また,zlib のヘッダである zlib.h には,マニュアルと同様の内容がコメントとして記述されています.利用している zlib が最新版と異なる場合,zlib.h を確認する方が良いかもしれません.おそらく /usr/include/zlib.h としてインストールされています. http://

  • zlib, libbzip2, XZ Utils の比較 - やた@はてな日記

    概要 zlib, libbzip2, XZ Utils に関するドキュメントを作成したので,各ライブラリによる圧縮・復元について,圧縮率,圧縮時間,復元時間を比較してみました.圧縮率は((圧縮後のサイズ)÷(圧縮前のサイズ))になっています. 各ライブラリに関するドキュメント zlib の使い方 libbzip2 の使い方 XZ Utils の使い方 実験設定 実験に用いた環境は,Amazon EC2 のハイ CPU ミディアム インスタンスです.インスタンスの詳細については,Amazon AWS のサイト(Amazon EC2(安全でスケーラブルなクラウド上の仮想サーバー)| AWS)をご確認ください.OS は Ubuntu 10.04 で,比較に用いたライブラリのバージョンは以下の通りです. ライブラリのバージョン zlib: 1.2.3.3 libbzip2: 1.0.5, 10-D

    zlib, libbzip2, XZ Utils の比較 - やた@はてな日記
  • γ符号、δ符号、ゴロム符号による圧縮効果 - naoyaのはてなダイアリー

    通常の整数は 32 ビットは 4 バイトの固定長によるバイナリ符号ですが、小さな数字がたくさん出現し、大きな数字はほとんど出現しないという確率分布のもとでは無駄なビットが目立ちます。 Variable Byte Code (Byte Aligned 符号とも呼ばれます) は整数の符号化手法の一つで、この無駄を幾分解消します。詳しくは Introduction to Information Retrieval (以下 IIR) の第5章に掲載されています。(http://nlp.stanford.edu/IR-book/html/htmledition/variable-byte-codes-1.html で公開されています) Variable Byte Code はその名の通りバイトレベルの可変長符号で、1バイトの先頭1ビットを continuation ビットとして扱い、続く 7 ビット

    γ符号、δ符号、ゴロム符号による圧縮効果 - naoyaのはてなダイアリー
  • 1