機械学習の分類問題は、識別モデルと生成モデルに大別される。 (識別関数によるアプローチもあるがここでは言及しない。) 自分の頭の整理のために、これらの違いをまとめる。 識別モデル(Discriminative model) サンプルデータがクラスに分類する条件付き確率を直接モデル化する。 分類時は、を選択する。 分類問題で求めたいのは、個々のデータがどのクラスに所属するかであり、識別モデルは所属確率を直接求めるモデルである。この考え方は最もシンプルで理にかなっており、機械学習で分類問題を解く場合、識別モデルによるアプローチが一般的な手法となっている。 生成モデル(Generative models) 観測データを生成する確率分布を想定し、観測データからその確率分布を推定する方法。 識別モデルと同様に条件付き確率をモデル化するがその方法が異なる。 (生成モデルでは直接これをモデル化しない。)
![識別モデルと生成モデル - 機械学習・自然言語処理の勉強メモ](https://cdn-ak-scissors.b.st-hatena.com/image/square/a5571747f3365083464fc76d0133f3334ce4085d/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fk%2Fkento1109%2F20180110%2F20180110105754.png)