1 統計的機械翻訳入門 統計的機械翻訳に関する講習会 2008.8.28-29 Patent Translation Task Group, Cluster of Focused Domains, NTCIR (NII Test Collection for IR Systems) Project 山本幹雄 筑波大学 講習会後修正版(2008.9) 2 講義目的と内容 • 目的 – 実習で用いるシステムの仕組みを理解する • 特にMosesという統計的機械翻訳システムについて理解する • 内容 – 統計的機械翻訳の概要 • 言語モデル: ngramモデル • 翻訳モデル: フレーズ翻訳モデル • デコーダ: Multistack & Beam-search – フレーズ翻訳モデルの推定 • 方向のある単語対応(IBMモデル,GIZA++) • 対称化単語対応 • フレーズペアの抽出 – 自