Avatar notebook default
19篇文章 · 9856字 · 1人关注
  • 2020-05-04

    介绍 在本练习中,您将使用一些特征选择算法来改进模型。有些方法需要一些时间才能运行,因此您将编写函数并验证它们是否适用于小样本。 要开始,只需运...

  • 数据泄露

    1.目标泄露:存在由y决定的x,即先发生y,后发生x。 2.训练测试污染:例如填补缺失值使用了全部的数据,在调用calling train_te...

  • Kaggle|Courses|XGBoost[待补充]

    In this tutorial, you will learn how to build and optimize models with g...

  • Kaggle|Exercise9|Cross-validation[GridSearch待补]

    In this exercise, you will leverage what you've learned to tune a machin...

  • Kaggle|Courses|Cross Validation[代码部分待补]

    什么时候使用交叉验证? Cross-validation gives a more accurate measure of model qual...

  • Kaggle|Exercise8|Pipelines

    管道最方便的地方就是pipeline 实现了对全部步骤的流式化封装和管理(streaming workflows with pipelines)...

  • Kaggle|Courses|Pipelines

    管道机制。管道捆绑了 预处理 和 建模 的步骤,可以使代码更简单和井井有条。虽然有一些数据科学家不使用管道,但是使用管道有一些重要的好处:-更整...

  • Kaggle|Exercise7:Categorical Variables[Very Important]

    By encoding categorical variables, you'll obtain your best results thus ...

  • kaggle|courese|Intro to ML|notebook

    想要建立仅包含选定特征的数据集,首先建立feature_names列表,然后可以直接使用dataframe的基本方法,df[列名]进行切片选择。...

文集作者