关键字 PAC总结理论:同等条件下,模型越复杂泛化误差越大。同一模型在样本满足一定条件的情况下,其数量越大,模型泛化误差越小,因此还可以说模型越...
1、特征选择 特征选择和降维计算一样,都能有效的减轻维数灾难问题,事实上,特征选择和降维计算是处理高维数据的两大主流技术。 对于一个学习任务来说...
关键字 样本的特征数称为维数(dimensionality),当维数非常大时,也就是现在所说的“维数灾难”,具体表现在:在高维情形下,数据样本将...
关键字 Q1:分类和聚类有什么不同? 第一,它们面对的根本问题不同。分类的根本问题是判断给定的某一个样本属于那一个类别;聚类的根本问题是探索给定...
关键字 集成学习是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。一般情况下...
关键字 概率,是机器学习中的重要角色,那么何谓概率?抛硬币时正面朝上的概率为0.5,这句话又代表着何含义呢?对于概率的理解往往有两种不同的方式:...
关键字 一根棍分开球。要求:尽量在放更多球之后,仍然适用。 干的不错? 在桌上放了更多的球,似乎有一个球站错了阵营。 SVM就是试图把棍放在最佳...
关键字 神经元模型:神经网络中简单单元就可以称为神经元。 一直沿用至今的“M-P神经元模型”正是对这一结构进行了抽象,也称“阈值逻辑单元“,其中...
关键字 信息增益:是特征选择中的一个重要指标,它定义为一个特征能够为分类系统带来多少信息,带来的信息越多,该特征越重要。 熵:那么如何衡量一个特...
文集作者