タグ

2012年5月23日のブックマーク (2件)

  • ハッカー道 - umitanuki's blog

    ここのところ毎日のようにBloomberg Westを見ているせいもあり、数週間にわたってベイエリアの話題はフェイスブックのIPO一色かと思うほどだ。今回のIPOは、マークザッカーバーグという人物やSNSという新しいマーケットということもあるが、規模の面でも異色だったことは間違いない。フェイスブックのIPOでミリオネア=資産一億円が何人生まれたかご存知だろうか。およそ1000人である。ミリオンダラーを抱えた彼らがパロアルトの社を中心に新居を探し始めたら、ウチの賃貸価格が跳ね上がることは間違いない。ただでさえ5年で二倍になったという話もあるぐらいである。全く人ごとではない。 そんなミリオネアを1000人出しても、あるいはInstagramを$1Bでザッカーバーグが「つい」買って来てしまっても、この会社の価値は先週の株式公開で約$100Bになったのでびくともしないわけである。公開前は$25か

    ハッカー道 - umitanuki's blog
    umitanuki
    umitanuki 2012/05/23
  • べき分布する整数データの圧縮方法 - アスペ日記

    今更ながら、Faster and Smaller N-Gram Language Modelsを読んでみました。 この記事については、すでにACL2011論文「Faster and Smaller N-Gram Language Models」を読んだ - EchizenBlog-Zwei やN-gram 言語モデルを圧縮するには - やた@はてな日記で紹介されているので、自分が興味を持ったところを少しだけ。 上の紹介記事でも言及されているように、この論文では N-gram を [token, context] の形で格納しています。token と context はどちらも ID。この形でソートすると、token も context も前のデータとの差が小さくなるので、差分を取ると小さい数が多い「べき分布」になるから圧縮しやすくていいよね、という話(だと思います)。 その圧縮方法というの

    べき分布する整数データの圧縮方法 - アスペ日記