umitanukiのブックマーク / 2012年5月23日

umitanuki id:umitanuki

2012年5月23日のブックマーク (2件)

ハッカー道 - umitanuki's blog
ここのところ毎日のようにBloomberg Westを見ているせいもあり、数週間にわたってベイエリアの話題はフェイスブックのIPO一色かと思うほどだ。今回のIPOは、マークザッカーバーグという人物やSNSという新しいマーケットということもあるが、規模の面でも異色だったことは間違いない。フェイスブックのIPOでミリオネア＝資産一億円が何人生まれたかご存知だろうか。およそ1000人である。ミリオンダラーを抱えた彼らがパロアルトの本社を中心に新居を探し始めたら、ウチの賃貸価格が跳ね上がることは間違いない。ただでさえ５年で二倍になったという話もあるぐらいである。全く人ごとではない。そんなミリオネアを1000人出しても、あるいはInstagramを$1Bでザッカーバーグが「つい」買って来てしまっても、この会社の価値は先週の株式公開で約$100Bになったのでびくともしないわけである。公開前は$25か
umitanuki 2012/05/23
リンク
べき分布する整数データの圧縮方法 - アスペ日記
今更ながら、Faster and Smaller N-Gram Language Modelsを読んでみました。この記事については、すでにACL2011論文「Faster and Smaller N-Gram Language Models」を読んだ - EchizenBlog-Zwei やN-gram 言語モデルを圧縮するには - やた＠はてな日記で紹介されているので、自分が興味を持ったところを少しだけ。上の紹介記事でも言及されているように、この論文では N-gram を [token, context] の形で格納しています。token と context はどちらも ID。この形でソートすると、token も context も前のデータとの差が小さくなるので、差分を取ると小さい数が多い「べき分布」になるから圧縮しやすくていいよね、という話（だと思います）。その圧縮方法というの
umitanuki 2012/05/23
algorithm
リンク
- 2012年5月27日
- 2012年5月23日
- 2012年5月21日