
参考王老师的ppt:https://github.com/wangshusen/DeepLearning 1. Processing Categorical Features...
我们做数据分析,在第一次拿到数据集的时候,一般会用统计学或可视化方法来了解原始数据。 了解列数、行数、取值分布、缺失值、列之间的相关关系等等,这个过程叫做 EDA(Explo...
本篇文章是随机森林气温预测任务的最后一篇文章啦,本文我们的主要内容就是 调参。前面在介绍随机森林算法的时候,我们知道在建立树模型的时候,我们通常会使用预剪枝策略,边建立决策树...
一、在建立线性回归模型之前需要考虑的: 1、数据预处理:线性回归是最简单的回归模型,模型具有很好的可解释性,因而广泛应用于医学统计建模领域。但由于其应用条件的限制,使得应用此...
循环神经网络(RNN)是基于序列数据(如语言、语音、时间序列)的递归性质而设计的,是一种反馈类型的神经网络,其结构包含环和自重复,因此被称为“循环”。它专门用于处理序列数据,...
一、基本概念 方差分析(analysis of variance)用于研究一个或多个分类型自变量与一个数值型因变量的关系。方差分析通过检验多个总体的均值是否相等来判断一个或多...
在正式开始任务前,我们先来导入工具包,并执行魔法指令: 今天使用的数据集是关于顾客小费的记录,可以直接使用 Pandas 读取该内置数据集: 读取结果: 假设,我们现在需要研...
一、特征二值化 二、特征归一化 (一)、总和标准化 (二)、标准差标准化 (三)、极大值标准化 (四)、极差标准化(区间放缩法,0-1标准化) 三、连续特征变换 四、定性特征...
前言 上一篇数据分析:数据预处理--标准化初解释(一)[https://www.jianshu.com/p/f3619f5d9a80]是在R中初步实现计算各类标准化的方法,没...
我已经忘了秋天,最凄美的时节,含着眼泪我与你分别不想顾忌太多,冬天已经来了,凛冬的湖面望不见春色时间是星星的眼睛,忘穿我的困惑 11.4 入门神经网络 介绍了神经网络的四要...
很多业务场景中,我们希望通过一个特定的函数来拟合业务数据,以此来预测未来数据的变化趋势。(比如用户的留存变化、付费变化等)本文主要介绍在 Python 中常用的两种曲线拟合方...
简介 主成分分析(PCA)和偏最小二乘法(PLS)是对变量数超过样本数量或变量之间存在多重共线性的组学数据进行可视化、回归、分类和特征选择的常用方法。 PLS和正交偏最小二乘...