タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

programmingとcompressionに関するhiromarkのブックマーク (2)

  • ユビキタスの街角 データ圧縮手法の応用

    PPM (Prediction by Partial Matching)というデータ圧縮アルゴリズムがある。 一般に、あるデータ列が与えられているとき、次に来るデータを予測することができればデータ圧縮を行なうことができる。 データ列から判断して次に来るデータが「a」だと確実に判断できるときは「a」を記述する必要が無いからである。 PPM法では、既存のデータ列中の文字列出現頻度を計算することによってこのような予測を行なう。 たとえば「abracadab」というデータの次にどの文字が来るか予測する場合、 「a」は4回、「b」は2回出現している 「b」の後に「r」が続いたことがある 「ab」の後に「r」が続いたことがある ... といった情報を累積して確率を推定する。 この場合、 (3)から考えて次の文字は「r」である確率が高いが、 (1)も考慮すると「a」の確率もある、という風に計算を行なう。

    hiromark
    hiromark 2007/02/15
    PPM の予測手法を応用。
  • 第2回 パズルみたいに楽しいデータ圧縮

    適当な圧縮ルールを作り,ASCII文字で描いた絵(図1)をなるべく少ない文字数で表現してください。 ある日のこと,ぼーっとした頭で仕事をしていると,同僚がそれはもう満面の笑みを浮かべて「プログラムで使っている画像データを圧縮するためにLZSS*1を実装してみたんですよ。ふふん,どうよ」と話しかけてきました。「ぬあ?」とそれがどうした的に返事をしつつも,ふと気づいたのは,何らかの圧縮プログラムやアルゴリズムを作った経験を持つプログラマは意外に多いということです。すでにzlibなどの著名な圧縮ライブラリが公開されていますが,「ブロックソート」や「PPM」などの新しい圧縮方法が日夜開発されています。 どうも圧縮というのは,プログラマ心をそそる何かがあるようです。今回はそんな圧縮アルゴリズムの不思議で魅力的なところを紹介します。パズルのような圧縮アルゴリズムの楽しさを感じていただければと思います。

    第2回 パズルみたいに楽しいデータ圧縮
    hiromark
    hiromark 2007/02/06
    結構わかりやすくて、リファレンスにいい。
  • 1