k最近邻算法(KNN，K-NearestNeighbor)————所谓K最近邻，就是K个最近的邻居的意思，说的是每个样本都可以用它最接近的K个邻居来代表。
最近邻居法采用向量空间模型来分类，概念为相同类别的案例，彼此的相似度高，而可以借由计算与已知类别案例之相似度，来评估未知类别案例可能的分类。

第十章 k最近邻算法

橙子还是柚子

我们将橙子和柚子使用颜色和个头特征进行图表建模，将待判断水果放入此模型中，查找距离它最近的几个邻居，根据橙子和柚子个数的多少来判断此水果更可能是什么，这就是KNN算法分类的使用。

要对物品进行分类时可使用这种算法。

根据模型将目标用户喜好相似用户的爱好推荐给目标用户，这也是KNN算法的应用。

我们进行建模的时候应该有一定的标准，这个时候就涉及到特征提取了。
在橙子还是柚子部分我们可使用颜色和个头进行二维（空间）数据的建模(x, y)。然后用毕达哥拉斯公式求取距离，即： √￣(x1-x2)^2 + (y1-y2)^2 // 同维数据差的平方和开平方

那么对于较为复杂的建模我们可以使用多维（空间）数据进行建模(v, w, x, y, z)，同样可使用毕达哥拉斯公式求取距离，来比较相似度。

我们还有余弦相似度的比较方式，一种以角度而非距离进行比较的公式（比如用来比较爱好相同，但打分规则权重不同的用户，都喜欢A，但是一个打4分，一个打5分，使用距离公式可能不是邻居）。

KNN可以做两项基本工作：分类和回归。

应用：

我们选择目标的最近邻居时的个数就是（KNN的）K值，这也是名字的由来。

应用简介