English latticelmはノンパラメトリックベイズ法に基づくPitman-Yor言語モデルを用いた単語分割と言語モデルの教師なし学習ツールです。 ツールの特徴は、通常のテキストだけではなく、ラティスからも学習できることです。 ラティスから言語モデルを学習することによって、連続音声など、入力にノイズが存在する場合でもよりロバストに言語モデルが学習できます。 詳しくは以下の論文をご参照ください。 Graham Neubig, Masato Mimura, Shinsuke Mori, Tatsuya Kawahara Learning a Language Model from Continuous Speech In Proceedings of InterSpeech 2010 Graham Neubig, 三村 正人, 森 信介, 河原 達也 ベイズ推論を用いた連続音声からの言