快乐的小飞熊

IP属地：浙江

决策树基础

332 0 0
logistic 回归（内附推导）
主要思考几个问题： 1、logistic回归的应用场景 Logistic回归是一种用于解决二分类问题的机器学习方法，是一种判别模型：表现为直接对...

0.1 8698 0 9

交叉验证梳理
疑问：为什么要分训练集、验证集、测试集？为什么采用交叉验证？交叉验证的应用场景是什么？最终预测模型是怎么得到的？预备知识：什么是超参数...

0.6 4425 2 11 1
1.1 Python科学计算生态
1.1.1 为什么使用python 1.1.1.1 科学家的需求获取数据（模拟、实验控制）操作和处理数据可视化结果、快速理解、绘制高质量图...

799 0 2
随机森林的优缺点
1、在当前的很多数据集上，相对其他算法有着很大的优势，表现良好2、它能够处理很高维度的数据，并且不用做特征选择，因为特征子集是随机选择的3、在...

0.1 9570 1 2
基于python的全面数据探索（house prices）
总体思路：理解问题：查看每个变量并且根据他们的意义和对问题的重要性进行哲学分析。单因素研究：只关注因变量(SalePrice)并且进行更深入的...

0.2 3109 0 5
什么是过拟合，如何避免？
过拟合：训练集上表现很好，但是在测试集上表现很差，泛化性能差。降低过拟合的方法：（1）试着寻找最简单的假设（2）正则化（3）early sto...

6340 0 1

随机森林中oob以及oob的作用？
在随机森林bagging法中可以发现booststrap每次约有1/3的样本不会出现在bootstrap所采集的样本集合中，故没有参加决策树的建...

0.3 15590 0 6 1
gbdt和随机森林的区别？
相同点：（1）都是由多棵树组成的，都是集成学习算法（2）最终的结果都是由多颗树一起决定不同点：(1)组成随机森林的树可以是分类树，也可以是回归...

5204 0 6