一.时间序列的平稳性 并不是所有的时间序列都是可预测的,想象一下,假如一个时间序列的变化特性是不稳定的,那么它每个时期的波动对于之后一个时期的变化的影响都是无法预测的,因为它...
一.时间序列的平稳性 并不是所有的时间序列都是可预测的,想象一下,假如一个时间序列的变化特性是不稳定的,那么它每个时期的波动对于之后一个时期的变化的影响都是无法预测的,因为它...
一.时间序列基本概念 1.什么是时间序列 时间序列,顾名思义就是按照时间顺利排列的一组数据,是同一现象在不同时间上的相继观察值排列而成的序列。根据观察时间的不同,时间序列中的...
Facebook 表示 Prophet 有两大优点: 开发合理、准确的预测模型更加直接。 Prophet 包含许多预测技术,比如 ARIMA 和 exponential sm...
一、日志相关概念 日志是一种可以追踪软件运行时所发生事件的方法。软件开发人员可以向他们的代码中调用日志记录相关的方法来表明发生了某些事情。一个事件可以用一个可包含可选变量数据...
一. 概述 在数据处理工作中,经常会遇到一种情况:给出一个日期序列,序列中缺少某几天,我们需要找出缺失的日期,并将其填补出来。具体看下面这个数据: 观察数据可以发现日期序列中...
1.引子 XGBoost在机器学习领域可谓风光无限,作为从学术界来的模范生,帮助工业界解决了许多实际问题,真可谓: 模型锋从学界出,算法香自公式来。 限于篇幅,本文就...
一. 概述 日常使用中,这三货都是用来 指定一个开始数据,指定一个结尾数据,指定一个步长,然后返回该范围内可迭代数据的,但是他们之间还是有细微差别的。 二. 具体看看 1. ...
pandas的数据合并与重塑有很多种方法,包括直接复制列,concat,append,merge和join,本文将重点讨论前面三种最简单而又最常用的方法。merge和join...
一.目的 时间序列是数据的一种常见表示形式,对于处理时间序列来说,一个普遍的任务就是比较两个序列的相似性。但是在实际问题中,大部分时间序列都是不等长的,有的序列可能波形类似,...
函数名:train_test_split所在包:sklearn.model_selection功能:划分数据的训练集与测试集参数解读:train_test_split (*a...
一. 前言 1. LLE 局部线性嵌入(Locally Linear Embedding,以下简称LLE)是非常重要的降维方法。和传统的PCA,LDA等关注样本方差的降维方法...
一. 前言 在前文讲述PCA降维算法时提到,PCA只能处理线性数据的降维,本质上都是线性变换,并且它仅是筛选方差最大的特征,去除特征之间的线性相关性。对于线性不可分的数据常常...
一.前言 主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用...
一. 前言 回归问题主要是求值,评价标准主要是看求得值与实际结果的偏差有多大,所以,回归问题主要以下方法来评价模型。 二. 评价方法 1. 均方误差(MSE) MSE (Me...
一. 如何判断过拟合与欠拟合 1. 根据训练集与验证集(测试集)的代价 d表示多项式的指数,d越大,模型越复杂。 欠拟合:模型复杂度不高时,若发生欠拟合,此时训练集与验证集的...
一. 什么是激活函数 神经网络中,输入神经元线性组合后,传入的非线性函数就是激活函数(大多是非线性的)。 二. 激活函数的主要功能 给神经网络引入非线性元素,使神经网络可以完...