第一课 了解SQL 1.1 数据库基础 ① 数据库:保存有组织的数据的容器② 表:某种特定类型数据的结构化清单③ 列 :表中的一个字段④ 数据...
一、数据来源 手写数字数据集 digit recognizor.csv 二、模型选择 降维算法选择decomposition模块下的PCA随机森...
一、数据来源 Sklearn自带数据集fetch_lfw_people 二、模型选择 降维使用Sklearn的decomposition模块下的...
一、数据集 Kaggle泰坦尼克数据集train.csv 二、模型选择 泰坦尼克数据集是二分类模型,本文选择使用随机森林模型进行调参。 三、数据...
一、数据集 Sklearn自带数据集——乳腺癌数据集 二、模型选择 乳腺癌数据集是二分类模型,选择随机森林模型进行调参 三、调参流程 1)简单建...
Sklearn 有专门处理缺失值的模块 sklearn.impute.SimpleImputer,本文将探究如何用 Sklearn 中的预处理模...
当我们拿到一份原始数据,首先会查看数据的基础信息,例如每一列数量统计,内存消耗、哪些列有缺失值等。完整的数据对于我们的数据分析工作来说意义重大,...
1. 项目背景 泰坦尼克号是当时世界上体积最庞大、内部设施最豪华的客运轮船,于1909年3月31日动工建造,,912年4月2日完工试航。于191...
一、背景介绍 Olist Store是巴西最大的一家在线百货公司,各个商家可以通过 Olist Store 来售卖他们的产品,并通过 Olist...