KNN--k nearest neighbor algorithm
应用领域:KNN方法主要用于模式识别,是机器学习中最简单的一种学习方法。
思想:一个数据归为哪类,由最近的K个邻居投票,把它归为票数最多的类。这K个邻居取自已知数据。
要考虑的问题:选择那种距离--欧式距离,海明距离...
如何选择K值?
如何克服噪声的影响?
海明距离 Hamming Distance
两个相等长度的字符串,挨个比较每个字符,相同为0不相同为1,那么最后1的个数就是海明距离。
交叉验证 cross validation
这篇文章讲的比较通俗易懂 :