算成绩表名:subject_scores 输入Name subject score王建国 数学 95王建国 语文 89李雪琴 数学 100李雪琴 ...
算成绩表名:subject_scores 输入Name subject score王建国 数学 95王建国 语文 89李雪琴 数学 100李雪琴 ...
对于常用的互联网数据指标,主要包含用户数据、行为数据、业务数据和推广付费数据等。 一、用户数据 1.活跃用户Q:为什么关注活用户数和活跃率?衡量当前的有效用户数和比例,评估产...
简单散点图的绘制, 使用plt.scatter(x,y)。 ⚠️:1,使用中,需要注意x y 轴的刻度的显示。此图的x无重复,所以刻度直接使用x没有问题,但是y数据多重复,在...
一、DDLHive中的DDL和MySQL中基本一致。 1.数据库的操作 2.表的操作2.1创建表相较于MySQL,Hive没有索引、主键。但是会有各种类型的表,如内部表、外部...
今天给大家整理了28张数据分析的知识地图,话不多说,直接上图: 1、数据分析步骤地图 2、数据分析基础知识地图 3、数据分析技术知识地图 4、数据分析师能力体系 5、数据分析...
本文只是针对数据分析师常用到数据查询时的调优技巧。 技巧1:列裁剪和分区裁剪(只选择我们用到的数据)(1)列裁剪:一般我们常见的数据宽表,可能有很多字段,几百个。select...
Pandas是基于Numpy的一种工具,主要是为了解决数据分析任务创建的。提供了大量能使我们快速便捷地处理数据的函数和方法。pandas 基于两种数据类型:Series和Da...
总结了一些常见的概率与统计类的数据分析面试题,不定期更新...... 随机变量的含义 一个随机事件的所有可能的值X,且每个可能值X都有确定的概率P,X就是P(X)的随机变量。...
最初我们用excel就可以做常规的数据存储和分析,但是当excel的数据超过10万条性能就不行了,有的版本的excel只能打开约6万条数据。后来,我们用mysql存储和查询数...