タグ

2011年10月24日のブックマーク (3件)

  • Exploiting generative models in discriminative classifiers - がくしゅう日記

    文献NIPS1998T. Jaakkola, D.Haussler2011/10/15 再読これは何度も読む価値がある文献.Fisherカーネルを, (1) モデルの判別力を高めるような計量(2) 生成モデルから得られたサンプルの自然な比較指標という2つの観点から導いている. (2)が原稿の文で議論され, (1)は付録に.(2)は, 対数尤度をモデルパラメタで微分したものが, 特定のサンプルの生成にパラメタがどの程度影響するかを測る尺度であることと,統計多様体における自然な計量がFisher計量であることから導かれる.(1)は, ロジスティック回帰において, ラベルの事後確率を計算するときの入力データの内積をスコアで記述するときに, 計量をFisher情報行列にすると, 背後にある生成モデルの下で最良の判別性を持つという性質から正当性を主張している.

  • https://imc.tut.ac.jp/~okabe/index.html

  • 30分でわかる高性能な圧縮符号vertical code - EchizenBlog-Zwei

    検索エンジンの転置インデックスなどデータ列を小さいデータサイズで持たせたい、という状況がある。こういう場合圧縮符号を使うのが一般的でunary符号やgamma符号、delta符号など様々な種類がある。 圧縮符号の中でイチオシなのがvertical code(vcode)。これは岡野原(@hillbig)氏によって提案された圧縮符号で単純な仕組みでdelta符号並の性能を誇っている。 記事ではvcodeのポイントを絞って30分でわかるように解説してみる。 vcodeは棚にを並べる作業を連想すると理解しやすい。棚は予め高さが決まっているので全てのが入るような棚を用意する。つまり というようなものを想像する。 この棚は8冊のが並んでいるが左から5冊目のが他よりも背が高い。このため5冊目のに合わせて背の高い棚が必要になる。だが他のは5冊目のほどに背が高くないので、5冊目が

    30分でわかる高性能な圧縮符号vertical code - EchizenBlog-Zwei