机器学习与数据挖掘 - 专题

投稿

收录了32篇文章 · 8人关注

正则化详解
机器学习模型需要拥有很好地泛化能力来适应训练集中没有出现过的新样本。在机器学习应用时，我们经常会遇到过度拟合(over-fitting)的问题，...

0.9 owolf 0 21
归一化和标准化大全
本人对这两个理解不是很深入，看了下面这些大佬的回答，还是模模糊糊，略懂一二。一、知乎高赞回答 1、特征工程中的「归一化」有什么作用？微调大佬...

1.6 owolf 2 22

jieba分词
参考：Python 中文分词组件 jiabaPython中文分词 jieba 十五分钟入门与进阶jieba完整文档$好玩的分词——python ...

0.3 领悟悟悟 1 1
常用激活函数比较
本文结构：什么是激活函数为什么要用都有什么 sigmoid ，ReLU， softmax 的比较如何选择 1. 什么是激活函数如下图，...

17.2 不会停的蜗牛 11 83
过采样中用到的SMOTE算法
平时很多分类问题都会面对样本不均衡的问题，很多算法在这种情况下分类效果都不够理想。类不平衡（class-imbalance）是指在训练分类器中所...

0.2 owolf 0 6
python sklearn模型中random_state参数的意义
random_state 相当于随机数种子random.seed() 。random_state 与 random seed 作用是相同的。随...

1.5 owolf 7 29
sklearn中的fit fit_transform和transfrom区别
数据挖掘通常包括数据采集，数据分析，特征工程，训练模型，模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作，在《使用sk...

0.7 Ten_Minutes 0 11

(二十八)项目实战|交易数据异常检测(三)-python数据分析与机器学习实战(学习笔记)
文章原创,最近更新：2018-06-4 1.混淆矩阵课程来源: python数据分析与机器学习实战-唐宇迪课程资料:这里所涉及到的练习资料c...

努力奋斗的durian 2 3
(二十七)项目实战|交易数据异常检测(二)-python数据分析与机器学习实战(学习笔记)
文章原创,最近更新：2018-06-4 1.交叉验证2.模型评估方法3.正则化惩罚4.逻辑回归模型课程来源: python数据分析与机器学习实战...

努力奋斗的durian 0 3
(二十六)项目实战|交易数据异常检测(一)-python数据分析与机器学习实战(学习笔记)
文章原创,最近更新：2018-06-1 1.案例背景和目标2.样本不均衡解决方案3.下采样策略课程来源: python数据分析与机器学习实战-...

努力奋斗的durian 2 6