机器学习模型需要拥有很好地泛化能力来适应训练集中没有出现过的新样本。在机器学习应用时,我们经常会遇到过度拟合(over-fitting)的问题,...
机器学习模型需要拥有很好地泛化能力来适应训练集中没有出现过的新样本。在机器学习应用时,我们经常会遇到过度拟合(over-fitting)的问题,...
本人对这两个理解不是很深入,看了下面这些大佬的回答,还是模模糊糊,略懂一二。 一、知乎高赞回答 1、特征工程中的「归一化」有什么作用? 微调大佬...
参考:Python 中文分词组件 jiabaPython中文分词 jieba 十五分钟入门与进阶jieba完整文档$好玩的分词——python ...
本文结构: 什么是激活函数 为什么要用 都有什么 sigmoid ,ReLU, softmax 的比较 如何选择 1. 什么是激活函数 如下图,...
平时很多分类问题都会面对样本不均衡的问题,很多算法在这种情况下分类效果都不够理想。类不平衡(class-imbalance)是指在训练分类器中所...
random_state 相当于随机数种子random.seed() 。random_state 与 random seed 作用是相同的。 随...
数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sk...
文章原创,最近更新:2018-06-4 1.混淆矩阵 课程来源: python数据分析与机器学习实战-唐宇迪 课程资料:这里所涉及到的练习资料c...
文章原创,最近更新:2018-06-4 1.交叉验证2.模型评估方法3.正则化惩罚4.逻辑回归模型课程来源: python数据分析与机器学习实战...
文章原创,最近更新:2018-06-1 1.案例背景和目标2.样本不均衡解决方案3.下采样策略 课程来源: python数据分析与机器学习实战-...
专题公告
机器学习与数据挖掘领域文章