■ 教師有学習 届いたメールが、「迷惑メール(スパム)」なのか、そうではなくて「通常のメール」なのかをコンピュータに判定させたい。 どのようにしてコンピュータに「迷惑メール」と「通常のメール」の違いを教えたらいいだろうか。 「○○や××のキーワードを含んでいたら迷惑メールと判断する」というような、ルールを1つ1つ人間の手で規定していくことも考えられるけど、これはあまりに単純すぎるし、実際に人間がルールを決めるのは大変すぎる。。 そこで、予め「迷惑メールである」と判定されたサンプルと、「迷惑メールではない」と判定されたサンプルをたくさん集めて、 コンピュータに勝手に「迷惑メールの特徴」というものを学習してもらおう、というアプローチが機械学習だ。 この例では、すでに「迷惑メールである」または「迷惑メールではない」という区別がついている正解データを使って、それぞれの特徴を学習するので 「教師有学