この前,Web+DBの特集を参考に構造化パーセプトロンによる仮名漢字変換を実装しました. Pythonで構造化パーセプトロンを実装してみた - nokunoの日記私は生成モデルでかな漢字変換を書いたことはあるので,どうしても生成モデルと識別モデルを比べたくなってしまいます.ということで生成モデルと構造化パーセプトロンを比べると,以下のようなメリットとデメリットがあることが分かりました. メリット 識別モデルなので同じ素性でも生成モデルより精度が良い スムージングとかも深く考えなくても自動的にやってくれる 品詞bigramと単語bigramの補間係数とか自分で考えたくない 特殊な作り込みによる素性も入れることができる 文字種の素性(ひらがな・カタカナ単語の重みを自動的に決定) 長さの素性(短い単語を抑制したりとか) 生成モデルの出力(?) デメリット 負例の生成に一貫性がない. 学習の初期段