Avatar notebook default
25篇文章 · 41167字 · 3人关注
  • Resize,w 360,h 240
    正则化详解

    机器学习模型需要拥有很好地泛化能力来适应训练集中没有出现过的新样本。在机器学习应用时,我们经常会遇到过度拟合(over-fitting)的问题,...

    0.9 9532 0 21
  • Resize,w 360,h 240
    归一化和标准化大全

    本人对这两个理解不是很深入,看了下面这些大佬的回答,还是模模糊糊,略懂一二。 一、知乎高赞回答 1、特征工程中的「归一化」有什么作用? 微调大佬...

    1.6 7770 2 22
  • Resize,w 360,h 240
    过采样中用到的SMOTE算法

    平时很多分类问题都会面对样本不均衡的问题,很多算法在这种情况下分类效果都不够理想。类不平衡(class-imbalance)是指在训练分类器中所...

  • Resize,w 360,h 240
    python sklearn模型中random_state参数的意义

    random_state 相当于随机数种子random.seed() 。random_state 与 random seed 作用是相同的。 随...

  • Resize,w 360,h 240
    EM算法

    一、EM算法介绍 我们经常会从样本观察数据中,找出样本的模型参数。 最常用的方法就是极大化模型分布的对数似然函数。(最大似然估计:利用已知的样本...

  • Resize,w 360,h 240
    Bagging与随机森林算法

    一、bagging的原理 从上图可以看出,bagging的个体弱学习器的训练集是通过随机采样得到的。通过T次的随机采样,我们就可以得到T个采样集...

  • Resize,w 360,h 240
    XgBoost算法

    一、XgBoost算法简介 在数据建模中,经常采用Boosting方法通过将成百上千个分类准确率较低的树模型组合起来,成为一个准确率很高的...

  • Resize,w 360,h 240
    GBDT集成算法(梯度提升树)

    一、算法思想 GBDT是集成学习Boosting算法中的一种,它与Adaboost相比,Adaboost算法利用前一轮迭代弱学习器的误差率来更...

  • Resize,w 360,h 240
    Adaboost集成算法

    一、Adaboost算法原理 从图中可以看出,Boosting算法的工作机制是首先从训练集用初始权重训练出一个弱学习器1,根据弱学习的学习误差率...

文集作者