K近邻算法将每组数据分到某个类中,其具体过程如下:
给出已知类别的数据集;
然后对于未知类别属性的数据集中的每个点依次执行以下操作:
1.计算已知类别数据集中的点与当前的点的距离;
2.按照距离依次排序;
3.选取与当前点距离最小的k个点;
4.确定前k个点所出现类别的出现频率;
5,返回前k个点中出现频率最高的类别作为当前点的预测分类。