1. 既有趣、又有益的交叉验证 validate your machine learning in a better way通过测试、验证,进而...
1. 数据维度 PCA 主成分分析principle component analysisPCA是一套全面应用于各类数据分析的分析方法,包括特征...
1. 为何使用特征选择? 特征选择背后的概念:事情应该力求简单,不过不能过于简单需要寻求尽量少的特征,但是却能真正把握数据的趋势和模式你的机器学...
1. 学习文本时的维度 Learning from text很多线上数据都是文本数据,比如网页、邮件等 文本学习的基本问题与输入特征相关 支持向...
1.Chris 的 T 恤尺寸(直觉) 在某些类型的机器学习算法中,特征缩放是特征预处理的一项重要步骤 特征缩放的作用进行特征缩放的必要性 2....
1. 非监督学习 在大多数情况下,从现实世界获取的数据并没有标记,也就不能告诉你正确答案因此非监督学习很重要 观察上面的图,可以认为数据中有簇或...
1.回归中的异常值 考虑异常值,假设线性回归将最小化误差的平方和,那么哪个是最佳的线性回归 2. 产生异常值的原因 传感器故障 ...
1.连续输出 本课关于连续(变量)的监督式学习The output variable has been constrained to binar...
机器学习的核心是你所拥有的数据和你想要回答的问题本课所用数据集:安然邮件数据利用该文库发现该欺诈案件的嫌疑人的电子邮件中是否存在某种模式,并检查...
文集作者