k近傍法とはデータを分類する時に活躍する手法です。 ある未知データが与えられたとき、周りの学習データのクラスからその未知データの分類を決定するもの。 そしてkとは手法に与えるパラメーターで、近くに存在する学習データのクラス数を示しています。 たとえば、このような状況では k=3なので未知データの周りの3つのデータを判断材料とします。 実際に見てみると、青〇のクラスが2つ、緑△のクラスが1つなので、未知データは青〇と判断されます。 続いてこのkを5にするとどうなるでしょう? k=5なので周りの5個を判断材料とします。 実際に見てみると、青〇のクラスが2つ、緑△のクラスが3つなので、未知データは緑△と判断されます。 kの値を変えることで分類されるクラスが変わりましたね! 今回挙げた例は非常に分類が難しい例であり、このような場合はそれほど多くありませんがkの値によって分類されるクラスが変わる可能