murawakiのブックマーク / 2011年4月29日

murawaki id:murawaki

2011年4月29日のブックマーク (4件)

CRFのヘシアン
坪井さんの論文がAAAIに通りました。おめでとうございます。AAAI記念ということで、宣伝その２。今回はCRFのヘシアンを具体的に計算してみます。入力文x、ラベル系列y、重みベクトルwに対して、CRFの対数尤度関数はです。fは特徴ベクトルで、普通f(x, y)と書きますが省略します。Zは分配関数です。正則化項を無視すれば、学習データに対するこの値の総和、が目的関数でした。この勾配はきれいな形をしていて、という形でかけます。NLP屋さん的にはここでおしまいですが、実はもう１回微分した形、つまりヘシアンもきれいな形で求まります。では頑張って微分しましょうというのが今回の主旨。まず、第１項のΣyfの項はwで微分すると消えます。考えないといけないのは第２項のE[f]の部分だけです。ベクトルの微分なのでちょっとめんどくさいです。もとの式に戻しましょう。ではwで微分しましょう。まずは積の微
murawaki 2011/04/29
ML
リンク
4月25日（月） | 横浜日記
この記事はブログのファンのみ閲覧できます
murawaki 2011/04/29
「この地震の間、中国でどのような「日本論」が跋扈したか、記録、記憶にとどめておくべきである。...デマなどでは片付けられない、きわめて酷い議論が大手を振ってまかり通っていることに注意しなければならない。」
リンク
DMPにおけるハイパーパラメータのサンプリングの仕方 - yasuhisa's blog
ハイパーパラメータの決め方Collapsed Gibbs samplingなどではパラメータは積分消去されることからハイパーパラメータが通常のパラメータの役割を果たすことが少なくありません。そういうわけで通常だと割と適当に「えいやっ!!」と決めてしまうようなハイパーパラメータをベイジアンな人たちは頑張って決める。LDAのときとかは経験ベイズっぽく最適化したり、DPMのハイパーパラメータのようなものはハイパーパラメータに事前分布(つまり、ハイパーハイパーパラメータが導入されるということである...)をかけて、ハイパーパラメータもサンプリングしてしまうのが普通らしい。どこまで事前分布を置くのが適切なのかは色々あるんだろうけど、とりあえずやり方だけは把握しておくことにする。 "Hyperparameter estimation in Dirichlet process mixture model
murawaki 2011/04/29
ML
リンク
China census shows population ageing and urban
murawaki 2011/04/29
リンク
- 2011年5月1日
- 2011年4月29日
- 2011年4月28日