A Hierarchical Bayesian Language Model based on Pitman-Yor Processes (HPYLM) 概要 A Hierarchical Bayesian Language Model based on Pitman-Yor Processes を読んだ A Bayesian Interpretation of Interpolated Kneser-Ney を読んだ C++でHPYLMを実装した はじめに HPYLMはPitan-Yor過程によるスムージングを行うベイズ階層n-gram言語モデルの一種です。 後で記事にしますが可変長ベイズ階層n-gram言語モデルであるVPYLMとは違いHPYLMはn-gramのオーダーを固定します。 スムージングとHPYLM テキストデータが以下の3文とします。 この時、たとえば単語列she will