タグ

2011年7月23日のブックマーク (4件)

  • Snappy servay

    2. google-snappy Snappy is a compression/decompression library. It does not aim for maximum compression, or compatibility with any other compression library; instead, it aims for very high speeds and reasonable compression. For instance, compared to the fastest mode of zlib, Snappy is an order of magnitude faster for most inputs, but the resulting compressed files are anywhere from 20% to 100% big

    Snappy servay
    py0n
    py0n 2011/07/23
    DSIRNLP#1で発表された資料。
  • 機械学習超入門III 〜機械学習の基礎、パーセプトロンを30分で作って学ぶ〜 - EchizenBlog-Zwei

    機械学習には大きく分けて「識別関数」「識別モデル」「生成モデル」の3つの種類がある。このなかで識別関数は確率を使わないので初心者が入門するのに最適。 識別関数で有名なのはSVM(Support Vector Machine、サポートベクターマシン)。名前を聞いたことがある人も多いと思う。そこで早速SVMを学ぼうとすると敷居が高くて挫折しがち。 実はSVMは(大雑把に言うと)パーセプトロンという基礎的な識別関数に「マージン最大化」と「カーネル関数」という考え方を導入したもの。なので機械学習入門者は最初にパーセプトロンを学ぶのが良いと思われる。 そこで早速パーセプトロンを作ってみよう!というのが記事の意図するところ。自分で実装できるとモチベーションが維持しやすいので、詳しく理論を学ぶ前にまずは作ってみようという考え。ちなみに実装にはperlを用いた。 参考: これからはじめる人のための機械学

    機械学習超入門III 〜機械学習の基礎、パーセプトロンを30分で作って学ぶ〜 - EchizenBlog-Zwei
    py0n
    py0n 2011/07/23
    後でやってみる。
  • Try For Trie | PDF

    What is Scribd?AcademicProfessionalCultureHobbies & CraftsPersonal GrowthAll Documents

    Try For Trie | PDF
    py0n
    py0n 2011/07/23
    後で読み返す。
  • Vertical Codeを調べたよ - EchizenBlog-Zwei

    故あってCompressed Suffix Array(CSA)を実装していたのだがΨ Vectorのデータ構造にunary符号を採用したら圧縮前よりもサイズが大きくなるという惨事が発生。 これに対処するため急遽データ構造をVertical Codeに変更した。デルタ符号(δ符号)並の圧縮率で、しかも高速らしい。 例えば index: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 value: 0 1 0 1 0 1 0 1 0 1 2 3 0 1 2 3というデータを考える。 Vertical Codeはデータを固定サイズM毎にブロックとして扱う。ここではM=8とする。また値はビット列に置き換え縦に並べる。すると最初のブロックは index: 0 1 2 3 4 5 6 7 value: 0 1 0 1 0 1 0 1 bit : 0 1 0 1 0 1 0

    Vertical Codeを調べたよ - EchizenBlog-Zwei
    py0n
    py0n 2011/07/23
    あとでよむ。