![Avatar notebook default](https://cdn2.jianshu.io/assets/default_avatar/avatar-notebook-default-640f7dde88592bdf6417d8ce1902636e.png)
引入 在对实际问题进行数据挖掘时,涉及到的特证数即数据维度往往是成百上千的,出于以下两个原因可能导致数据集质量不佳: 噪声特征:该特征并不能对我...
引言 我们需要一定的准则来评估不同机器学习模型的优劣,这就引申出损失函数和风险函数。 损失函数:评估模型单次预测的好坏 风险函数:度量平均意义下...
前言 当我们根据数据训练出一个机器学习模型时,我们希望它在新的数据上也保持较高的准备率,这就需要我们对学习到的不同模型有一个模型评估准则。 为了...
前言 同梯度下降法一样,牛顿法和拟牛顿法也是求解无约束最优化问题的常用方法。牛顿法本身属于迭代算法,每一步需要求解目标函数的海赛矩阵的逆矩阵,计...
综述 机器学习中经常会在损失函数中加入正则项,称之为正则化Regularize。 目的:防止模型过拟合 原理:在损失函数上加上某些规则(限制),...
简介 传统的线性回归模型预测的因变量取值范围为任意实数,在实际应用中我们常常需要对非连续型数据建模,其中一类的典型的数据即是定序数据ordina...
概念:人工智能与机器学习[1] 人工智能涵盖了其他所有概念,而机器学习是人工智能的一个子方向,深度学习又是机器学习中的一类方法。至于机器视觉和自...
需要泊松回归的原因 对因变量是离散型变量的问题建模时,普通的线性回归模型、定序回归模型和逻辑回归模型已经能解决我们大部分的需求。但有一类特殊的因...
以二分类问题为例,我们假设特征集合为,样本所属类别为,后验概率为: 其中是类的先验概率;是样本相对于类标记的类条件概率;代表样本x出现的概率,但...
文集作者