10:20-12:00 音声ドキュメント処理 Automatic Speech Recognition and Machine Translation System for MIT English Lectures using MIT and TED Corpus ○Veri Ferdiansyah, Seiichi Nakagawa(Toyohashi Univ. of Tech.) MITコースウェアに字幕を付けるため,音声の自動書き起こしと翻訳を行う.MIT OpenCourseWareの音声で適応(30人,5時間).適応手法,言語モデルの学習データ(WSJ, MIT OpenCourseWare)を比較.翻訳モデルでは,日本語側でCSJ, TED Talks, JENAADを組み合わせて利用.認識ではWSJに対してMAP推定でMITコーパスを適応させたものがよかった.翻訳の学習デー