买球(中国)官方网站/IOS/Android通用版/手机APP

机器学习算法优劣的简单介绍

1、朴素贝叶斯朴素贝叶斯是一种简单而强大的预测建模算法。 K 最近邻算法K 最近邻（KNN）算法是非常简单而有效的。KNN 的模型表示就是整个训练数据集。学习向量量化KNN 算法的一个缺点是，你需要处理整个训练数据集。

2、支持向量机是最受欢迎的机器学习算法之一，通过超平面分割输入变量空间中的点与它们的类。超平面最大化间隔，从而能够正确地将两个类分开。支持向量机可能是最强大的分类器之一，值得在数据集上尝试。随机森林和Bagging是集成学习算法，通过组合多个模型来提高预测准确性。

3、机器学习，基础的PCA模型理论，贝叶斯，boost，Adaboost，模式识别中的各种特征，诸如Hog，Haar，SIFT等深度学习里的DBN，CNN，BP，RBM等等。非专业出身，只是略懂一点。

4、学习向量量化算法（简称 LVQ）学习向量量化也是机器学习其中的一个算法。可能大家不知道的是，K近邻算法的一个缺点是我们需要遍历整个训练数据集。学习向量量化算法（简称 LVQ）是一种人工神经网络算法，它允许你选择训练实例的数量，并精确地学习这些实例应该是什么样的。

机器学习算法优劣的简单介绍

正确性能正确地实现预定的功能，满足具体问题的需要。处理数据使用的算法是否得当，能不能得到预想的结果。易读性易于阅读、理解和交流，便于调试、修改和扩充。

准确率（Accuracy）正确预测的样本数占总样本数的比例。精确率（Precision）正确预测为正例的样本数占预测为正例的样本数的比例。召回率（Recall）正确预测为正例的样本数占实际为正例的样本数的比例。F1-score：精确率和召回率的调和平均数，同时考虑了二者的表现。

混淆矩阵：用于比较分类结果和实例的真实信息，矩阵中的每一行代表实例的预测类别，每一列代表实例的真实类别。准确率（Accuracy）：最常用的分类性能指标，即正确预测的正反例数除以总数。精确率（Precision）：针对预测正确的正样本，表现为预测出是正的里面有多少真正是正的。

这种算法的缺点具体体现在六点，第一就是样本不平衡时，预测偏差比较大。第二就是KNN每一次分类都会重新进行一次全局运算。第三就是k值大小的选择没有理论选择最优，往往是结合K-折交叉验证得到最优k值选择。第四就是样本不平衡问题（即有些类别的样本数量很多，而其它样本的数量很少）效果差。

最近邻算法可以应用于各种各样的场景。它可以被用来识别图片中的物体，或者预测用户可能会喜欢什么样的商品。在这种算法中，最近的邻居被认为是最相似的，因此被用来做出决策。这种算法的好处在于它非常容易实现，但是对于大型数据集来说，计算时间可能会很长。在日常生活中，nearest也是一个常用的词汇。

计算量大，尤其是特征数非常多的时候，每一个待分类的样本都要计算它到全体已知样本的距离，才能得到它的第K个最近邻点。可理解性差，无法给出像决策树那样的规则。是惰性算法，基本上不学习，导致预测时速度比起逻辑回归之类的算法慢。样本不平衡的时候，对稀有类别的预测准确率低。

意义最佳码本的设计原则和最近邻原则是两个重要的数据处理算法，它们在数据压缩、机器学习等领域中具有广泛应用。通过合理应用这些算法，可以提高数据处理效率和准确性，从而更好地满足实际需求。

K 最近邻算法K 最近邻（KNN）算法是非常简单而有效的。KNN 的模型表示就是整个训练数据集。学习向量量化KNN 算法的一个缺点是，你需要处理整个训练数据集。支持向量机支持向量机（SVM）可能是目前最流行、被讨论地最多的机器学习算法之一。

人工智能中的算法种类神经网络算法：人工神经网络系统是20世纪40年代后出现的。它是由众多的神经元可调的连接权值连接而成，具有大规模并行处理、分布式信息存储、良好的自组织自学习能力等特点。K-最近邻算法（K-NearestNeighbors，KNN）非常简单。