
17.1 大型数据集的学习 如果我们有一个低方差的模型,增加数据集的规模可以帮助你获得更好的结果。我们应该怎样应对一个有100万条记录的训练集?...
看到推荐系统的时候,我是很兴奋的,因为我很多同学都是走这个方向的,然而,我却对这个方向一点都不了解 。。。。。。 16.1 问题形式化 在很多企...
15.1 问题的动机 接下来,我将介绍异常检测(Anomaly detection)问题。。这是机器学习算法的一个常见应用。这种算法的一个有趣之...
14.1 动机一:数据压缩 其实当我们看到降维的时候,也会很自然地想起数据压缩,数据压缩带给我们的好处有很多,例如不占磁盘很多空间,加快学习算法...
13.1 聚类简介 聚类是一个非监督学习的算法,监督学习和非监督学习的介绍在第一章:监督学习VS非监督学习 - 简书上面有详细介绍。 在一个典型...
12.1 大边界的直观理解 先直观理解一下支持向量机,人们有时将支持向量机看作是大间距分类器。 具体而言,如果你考察这样一个数据集,其中有正样本...
11.1 首先要做什么 接下来,我们会谈到机器学习系统的设计。下面的课程的的数学性可能不是那么强,但是我认为我们将要讲到的这些东西是非常有用的,...
10.1 决定下一步做什么 到目前为止,前面已经介绍了许多不同的学习算法。 但是有个问题,当我们使用机器学习的时候,如何确保我们在设计机器学习的...
9.1 代价函数 首先引入一些便于稍后讨论的新标记方法: 假设神经网络的训练样本有个,每个包含一组输入和一组输出信号,表示神经网络层数,标书输出...
文集作者