聚类算法是一种无监督机器学习模型,可以直接从数据内在的性质中学习最优的划分结果或者确定离散标签类型。 k-maens算法在不带标签的多维数据集中...
用PCA做噪音过滤 PCA用做噪音过滤的方法——任何成分的方差都远大于噪音的方差,相对于噪音,主成分相对不受到影响。 因此,仅利用主成分的最大子...
主成分分析是一个应用广泛的无监督方法,适用于数据可视化、噪音过滤、特征抽取和特征工程领域,主要用于数据降维。 和之前的有监督学习中用x值预测y值...
通过组合多个过拟合评估器来降低过拟合程度,实质上是一种集成学习方法,通常称为装袋算法。 虽然每个评估器都对数据过拟合,但是通过求取均值的方式,最...
支持向量机(SVM)是非常强大,灵活的有监督学习算法,既可以用于分类,也可以用于回归。 支持向量机其实就是一个边界最大化评估器。支持模型拟合的关...
吴恩达机器学习之正则化(Regularization)http://www.cnblogs.com/jianxinzhou/p/4083921....
特征工程——找到与问题有关的任何信息,把他们转化为特征矩阵的数值。 这个过程通常被称为向量化,因为它把任意格式的数据转换成了具有良好特性的向量形...
理解机器学习中的偏差与方差https://blog.csdn.net/simple_the_best/article/details/71167...
模型验证就是在选择完模型和超参数之后,通过训练数据进行学习,对比模型对已知数据的预测值与世实际值的差异。 主要方式有留出集和交叉验证。 留出集 ...
文集作者