タグ

ブックマーク / hillbig.cocolog-nifty.com (2)

  • SBM研究会発表資料 - SBMの推薦アルゴリズム - DO++

    先週末東工大で開催された第3回SBM研究会の発表資料です。 * SBMの推薦アルゴリズム [pdf] [pptx] - はてブの関連エントリで利用されているBayesian setsの解説とその改良(とチューニングちょっと) - Locality Sensitive Hash (LSH)の解説と実験結果.結構うまくいった (最初のエコは大切というのは前の発表からの流れです) ---- 研究会は熱心な人がたくさんいて、twitterでリアルタイムな反応がみれるなど新鮮でした。

    SBM研究会発表資料 - SBMの推薦アルゴリズム - DO++
    tsupo
    tsupo 2009/09/16
    「SBMの推薦アルゴリズム」 はてブの関連エントリで利用されているBayesian setsの解説とその改良
  • LZ法再び - DO++

    可逆データ圧縮としてはgzipやlha, pngなどダントツで使われているLZ法(Lemple Ziv法)ですが、他のデータ圧縮法(BWT法、PPM法、CM法)に比べ圧縮率が低いということで研究の対象としてはあまり注目をあびていませんでした。ところが次の論文で真面目にやれば圧縮率は非常に高くなる可能性があり、BWT法とかそれを超える可能性があることが示されています。。 "On the bit-complexity of Lempel-Ziv compression", SODA 2009, P. Ferragina, et. al. [pdf] まず、LZ法についておさらいですが、基的にはデータを前から順番に見ていったときに、既に出現した文字列がもう一度出現(マッチング)したら、その文字列を前回出現した(相対)位置と長さのペア(pos, len)で置き換えることで圧縮する方法です。データ

    LZ法再び - DO++
    tsupo
    tsupo 2008/10/22
    真面目に最長&最右一致を全過去の文脈から探すと圧縮率は非常に高くなる / 数文字スキップしたらもっと長いマッチングがあって全体を小さくできる可能性 / 最長&最右一致よりも更に数%圧縮率を向上可能
  • 1