昨晩から頭痛がしていたので朝布団の中で逡巡。いや、そこ迷っちゃいかんだろう。 午後機械翻訳勉強会。katsuhiko-h くんが Hui Zhang, Min Zhang, Haizhou Li, Chew Lin Tan. Fast Translation Rule Matching for Syntax-based Statistical Machine Translation. EMNLP 2009. を紹介してくれる。統語ベースの機械翻訳システムは、翻訳するとき入力文に対して解析木(parse tree)を作成し、その木に対して部分木や森(forest)のマッチを行い、マッチしたところをなんらかの基準で選択して順に翻訳する、というステップで翻訳するのだが、句(phrase)ベースのシステムに比べ、マッチするべき木(森)が多すぎる、という問題があった。そこを解決した、というのがこの論