邻近算法的缺点

如题所述

第1个回答 2016-05-14

该算法在分类时有个主要的不足是，当样本不平衡时，如一个类的样本容量很大，而其他类样本容量很小时，有可能导致当输入一个新样本时，该样本的K个邻居中大容量类的样本占多数。该算法只计算“最近的”邻居样本，某一类的样本数量很大，那么或者这类样本并不接近目标样本，或者这类样本很靠近目标样本。无论怎样，数量并不能影响运行结果。
该方法的另一个不足之处是计算量较大，因为对每一个待分类的文本都要计算它到全体已知样本的距离，才能求得它的K个最近邻点。
可理解性差，无法给出像决策树那样的规则。

相似回答

实验二 K-近邻算法及应用答：（2）可理解性差，无法给出像决策树那样的规则。（3）是慵懒散学习方法，基本上不学习，导致预测时速度比起逻辑回归之类的算法慢。（4）样本不平衡的时候，对稀有类别的预测准确率低。当样本不平衡时，如一个类的样本容量很大，而其他类样本容量很小时，有可能导致当输入一个新样本时，该样本的K个邻...

最邻近规则分类(K-Nearest Neighbor)KNN算法(七)答：4.2 算法缺点注意：在选择k的时候，一般k为奇数，因为保证了结果相等的出现情况被排除了，如果选择偶数，可能会出现结果相等考虑距离，根据距离加上权重（比如: 1/d (d: 距离）---表示加权重来计算大小）

01 KNN算法 - 概述答：1、蛮力实现(brute)：计算预测样本到所有训练集样本的距离，然后选择最小的k个距离，即可得到k个最邻近点。缺点：当特征数多、样本数多时，算法的效率比较低。2、KD树 (kd_tree)：首先对训练数据进行建模，构建KD树，然后根据建好的模型来获取邻近样本数据。后续内容会介绍KD树搜索最...

邻近算法的改进策略答：该算法比较适用于样本容量比较大的类域的自动分类，而那些样本容量较小的类域采用这种算法比较容易产生误分。分类效果：采用权值的方法（和该样本距离小的邻居权值大）来改进，Han等人于2002年尝试利用贪心法，针对文件分类实做可调整权重的k最近邻居法WAkNN (weighted adjusted k nearest neighbor)，以促进...

大家正在搜

邻近点算法算法的优缺点粒子群算法的优缺点递推算法的优缺点自然语言描述算法的主要缺点邻近适应算法 k最近邻算法 k邻近算法实际应用 knn邻近算法应用