2011年4月29日のブックマーク (4件)

  • CRFのヘシアン

    坪井さんの論文がAAAIに通りました。おめでとうございます。AAAI記念ということで、宣伝その2。今回はCRFのヘシアンを具体的に計算してみます。 入力文x、ラベル系列y、重みベクトルwに対して、CRFの対数尤度関数は です。fは特徴ベクトルで、普通f(x, y)と書きますが省略します。Zは分配関数です。正則化項を無視すれば、学習データに対するこの値の総和、 が目的関数でした。この勾配はきれいな形をしていて、 という形でかけます。NLP屋さん的にはここでおしまいですが、実はもう1回微分した形、つまりヘシアンもきれいな形で求まります。では頑張って微分しましょうというのが今回の主旨。 まず、第1項のΣyfの項はwで微分すると消えます。考えないといけないのは第2項のE[f]の部分だけです。ベクトルの微分なのでちょっとめんどくさいです。もとの式に戻しましょう。 ではwで微分しましょう。まずは積の微

    murawaki
    murawaki 2011/04/29
  • 4月25日(月) | 横浜日記

    この記事はブログのファンのみ閲覧できます

    4月25日(月) | 横浜日記
    murawaki
    murawaki 2011/04/29
    「この地震の間、中国でどのような「日本論」が跋扈したか、記録、記憶にとどめておくべきである。...デマなどでは片付けられない、きわめて酷い議論が大手を振ってまかり通っていることに注意しなければならない。」
  • DMPにおけるハイパーパラメータのサンプリングの仕方 - yasuhisa's blog

    ハイパーパラメータの決め方Collapsed Gibbs samplingなどではパラメータは積分消去されることからハイパーパラメータが通常のパラメータの役割を果たすことが少なくありません。そういうわけで通常だと割と適当に「えいやっ!!」と決めてしまうようなハイパーパラメータをベイジアンな人たちは頑張って決める。LDAのときとかは経験ベイズっぽく最適化したり、DPMのハイパーパラメータのようなものはハイパーパラメータに事前分布(つまり、ハイパーハイパーパラメータが導入されるということである...)をかけて、ハイパーパラメータもサンプリングしてしまうのが普通らしい。どこまで事前分布を置くのが適切なのかは色々あるんだろうけど、とりあえずやり方だけは把握しておくことにする。 "Hyperparameter estimation in Dirichlet process mixture model

    DMPにおけるハイパーパラメータのサンプリングの仕方 - yasuhisa's blog
    murawaki
    murawaki 2011/04/29
  • China census shows population ageing and urban

    murawaki
    murawaki 2011/04/29