でも、遊んでばかりいるわけではアリマセン! というわけで聞いてきた内容でも書いてみると、今日の午前中のセッションでは Discriminative, Syntactic Language Modeling through Latent SVMs Colin Cherry & Chris Quirk (Microsoft Research) AMTA 2008 がおもしろかった。やりたいこととしては機械翻訳の出力が(Nグラムを用いた)言語モデルではスコアが高くなってしまう、という問題が知られており、本当の翻訳文と機械翻訳の出力を比較したとき、本当の翻訳文のほうがスコアが高くなるようにしたい、というのが動機。実際、(Och et al. 2004) では P(機械翻訳の出力) > P(機械翻訳の出力のうち、一番いい翻訳) > P(正解文) となっているそうで、言語モデルが適切に機能していない、