在很多研究中,我们需要的变量都不能或者不容易被直接测量,比如,假如我们要研究家庭环境和学校环境对学生成绩的影响,我们要如何测量家庭环境和学校环境...
在很多研究中,我们需要的变量都不能或者不容易被直接测量,比如,假如我们要研究家庭环境和学校环境对学生成绩的影响,我们要如何测量家庭环境和学校环境...
作者: 于饼喵阅读时间:10min 有时我们需要将样本按照特征分为不同的类,比如,金融机构需要根据客户的特征将客户划分不同的等级,这时聚类算法可...
PCA用于信息压缩,那么什么是信息呢?决策树中,用熵代表信息,而在PCA中,用方差来衡量信息。 从高纬度的信息中提取主要信息,以此达到压缩信息【...
15.1 时间序列--概念 15.1.1 概念 横截面数据:在一个给定的时间点测量变量值 纵向数据:随着时间的变化反复测量变量值 对时序数据的研...
15.4.1 平稳性(stationarity) 平稳的时间序列的性质不随观测时间的变化而变化【样本时间序列所得到的拟合曲线在未来一段时间内仍能...
15.3 时间序列的预测 15.3.1 指数预测模型 单指数平滑 t+1预测值可以看成是第t期预测值和真实值的加权,也可以看成是第t期的预测值再...
日常工作中,一般我们自己使用python写入数据时,会选择txt、csv等文件格式,或者直接写入数据库,但是在帮别人写外包爬虫,或者职场中需要使...
项目简述 上文【2020python数据分析项目:爬取某宝口红数据&数据分析可视化(一)】对数据进行了收集、清洗以及从整体的角度进行分析,本文主...
项目简述 马云说:“未来最值钱的不是房子,也不是石油,而是数据”。阿里旗下的某宝,作为一个最大的电商平台,其数据蕴含了巨大的价值,而不断发展的美...
CREATED BY TAO 前言:我们掌握多种数据分析工具不是为了炫耀技能,而是为了用最快、最简便、最适合的方法进行数据分析。 首先在pyth...
专题公告
主要收录大数据、数据分析、数据挖掘、机器学习、搜索、数据展示等等与数据相关的文章。
也会收录少量与python和shell相关的内容。毕竟python是数据分析领域的常用语言,而从事大数据相关工作一般用Linux系统的比较多。