秋招-算法 - 专题

投稿

秋招-算法

收录了58篇文章 · 8人关注

随机森林如何处理缺失值
序 RF中有相应的缺失值处理方法，本次记录其两种缺失值处理技巧暴力填补 Python中的na.roughfix包提供简单的缺失值填补策略：对于...

0.4 0过把火0 1 4
随机森林如何评估特征重要性
序集成学习模型的一大特点是可以输出特征重要性，特征重要性能够在一定程度上辅助我们对特征进行筛选，从而使得模型的鲁棒性更好。随机森林中进行特征...

0.2 0过把火0 0 4

Boosting
序 boosting是集成学习中的一个大家族，本次记录boosting的相关概念以及与bagging的区别。 boosting思想 Boosti...

0过把火0 0 0
决策树剪枝
为何要剪枝决策树递归地构建树，直到不能继续分裂下去为止，这样的树对于训练集可能拟合的较好，但对于训练集可能产生过拟合现象，原因是过多的考虑对训...

0.1 0过把火0 0 1
集成学习
序本次以及后续几次博客将陆续记录关于集成学习模型的相关知识点。 Ensemble概述集成学习就是构造若干模型并用它们的（加权预测/投票）值...

0过把火0 0 0
模型方差与偏差
序面试过程中经常会被问到关于方差和偏差的概念以及比对。偏差偏差度量了学习算法的期望预测值与真实结果间的偏离程度，也就是刻画了模型本身的拟合...

0过把火0 0 0
Bagging与随机森林
序集成学习大类中常见的有两个子类：Bagging和Boosting。本次记录一下Bagging以及其代表模型RandomForest。 Bag...

0.1 0过把火0 0 1

朴素贝叶斯
序本次记录朴素贝叶斯的相关原理，并上一张手写的面试级推导过程朴素贝叶斯模型是什么？朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。...

0.1 0过把火0 0 1
决策树
序本次记录一下决策树的相关概念以及思想，后面博客再贴上具体的算法原理一句话介绍决策树是一种基本的分类与回归的判别式模式，在分类问题中，表示...

0过把火0 0 0
信息熵与基尼指数的关系
序熵的概念中有信息熵、信息增益、信息增益比、基尼指数，这些统统作为决策树分裂的依据，其中，我们需要知道信息熵与基尼指数的关系。信息熵与基尼指...

0过把火0 0 0