k近傍法とはデータを分類する時に活躍する手法です。 ある未知データが与えられたとき、周りの学習データのクラスからその未知データの分類を決定するもの。 そしてkとは手法に与えるパラメーターで、近くに存在する学習データのクラス数を示しています。 たとえば、このような状況では k=3なので未知データの周りの3つのデータを判断材料とします。 実際に見てみると、青〇のクラスが2つ、緑△のクラスが1つなので、未知データは青〇と判断されます。 続いてこのkを5にするとどうなるでしょう? k=5なので周りの5個を判断材料とします。 実際に見てみると、青〇のクラスが2つ、緑△のクラスが3つなので、未知データは緑△と判断されます。 kの値を変えることで分類されるクラスが変わりましたね! 今回挙げた例は非常に分類が難しい例であり、このような場合はそれほど多くありませんがkの値によって分類されるクラスが変わる可能
![k近傍法とは?理論とRでの実装方法!|スタビジ](https://cdn-ak-scissors.b.st-hatena.com/image/square/b2e7787e0e07323d4f869cdac2baa200ad1ae8bf/height=288;version=1;width=512/https%3A%2F%2Ftoukei-lab.com%2Fwp-content%2Fuploads%2F2019%2F12%2Fkkinnbou-e1576565062327.jpg)