タグ

compressionに関するHashのブックマーク (3)

  • Google Snappy (Twitter JSONの圧縮)

    以前のブログ でSnappyを試してみた内容を記載しましたが、圧縮対象のデータはSnappyライブラリに同梱のテストデータだったので、実際的なデータを用いるとどの程度の圧縮率になるか見てみたかったので試してみました。 一番手軽に試せるのがTwitterのStreaming API...

    Google Snappy (Twitter JSONの圧縮)
  • 【コラム】攻略! ツール・ド・プログラミング (52) Googleが開発した高速圧縮ライブラリ「Snappy」をJavaで使う | エンタープライズ | マイナビニュース

    「Snappy」はGoogle社が開発した高速圧縮/伸長(解凍)ライブラリである。もともとは「Zippy」という名称で知られていたものだが、BSD Licenseに基づいてオープンソース化され、誰でも利用できるようになった。ZippyはBigTableやMapReduceから内部的なRPC処理にいたるまで、Google社内のあらゆるプロジェクトで利用してきた実績を持つ。 Snappyの最大の特徴は、圧縮/伸張の実行速度である。シングルコアのIntel Core i7プロセッサにおけるベンチマークでは、圧縮で毎秒250MB以上、伸張で毎秒500MB以上の性能を実現しているという。一方で圧縮率はzlibやLZOといった主要なツールよりも劣る。圧縮率はプレーンテキストで1.5から1.7倍、HTMLで2から4倍、JPEGやPNGといった圧縮済みのファイルフォーマットでは1.0倍となっており、これは

    Hash
    Hash 2012/10/08
    SnappyはGoogle製の高速な圧縮ライブラリ. 圧縮率はそんな高くないけどとにかく速いそうな
  • BlockSorting

    BlockSortingは、今までのデータ圧縮で有名な方法であるLZ法とは全く違う、ユニークな操作を用 いてデータを圧縮する方法であり、M.BurrowsさんとD.J.Wheelerさんが作者なので「BWTransform」 ともいいます。 このアルゴリズムは簡単に言ってしまえば、「データをぐるぐる回してソートして出力」というも のです。簡単すぎるかもしまいませんが、当にそうなんです。 ちなみに、このBlockSorting、単体では全く圧縮しません。ただ可逆な形にデータを変換すると いうものです。しかし、BlockSorting後のデータは非常に圧縮されやすい状態になります。例える と、色々な形をしたスポンジ(データ)が箱にごちゃごちゃに入って山積みになっているとします 。 これをそのまま上からギューっと押しつぶすのがLZ法やHuffman法なのに対し、一度、形が似た も

  • 1