13.1 未标记样本 有标记样本有训练集Dl={(x1,y1),(x2,y2),…,(xl,yl)},这l个样本的类别标记已知,即"有标记样本"...
本章是关于机器学习的理论基础,其目的是分析学习任务的困难本质,为学习算法提供理论保证,并根据分析结果指导算法设计。 12.1 基础知识 本章主要...
11.1 子集搜索与评价 我们将属性称为特征相关特征:对当前学习任务有用的属性。无关特征:对当前学习任务无用的属性。特征选择:从给远的特征集合中...
10.1 k近邻学习(KNN) "急切学习":在训练阶段对训练样本进行学习处理的方法。"懒惰学习":在训练阶段仅仅是把训练样本保存起来,训练时间...
9.1 聚类任务 在无监督学习任务中,包括了密度估计、异常检测以及聚类等。其中应用最广泛的是聚类。 聚类就是对大量未知标注的数据集,按照数据的内...
8.1 个体与集成 集成学习是通过构建并结合多个学习器来完成任务。 集成学习的一般结构:一组"个体学习器"通过某种策略将它们结合起来。 集成学习...
7.1 贝叶斯决策论 1.相关概率 1)先验概率:在事情发生之前事情发生的概率。是根据以往经验和分析得到的概率。可以表示为样本空间中各类样本的占...
6.1 间隔与支持向量 开倍速观看视频之后,对课本所说的会更加了解。支持向量机讲解:https://www.bilibili.com/video...
5.1 神经元模型 1.神经网络 神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交...
文集作者