《数据化运营速成手册》,作者胡晨川,第三章:数据图表进阶
这一章作者继续了图表的话题,讲述了一些稍微高级的图表技巧,这里简单整理一些我感觉实用些的内容。
作者把数据分析师比作厨师,我想那整个数据行业就算是厨房了,工作这些年也算是在厨房中工作了好久,一开始做做摆盘,后来开始洗菜,再然后开始买菜选菜切菜,而今开始站在案板面前做一道菜了,认认真真的做一道菜。
做数据分析,做数据图表的第一步是了解拿到的数据,了解数据中有哪些指标、哪些维度,数据质量如何。
如何选择图表,可以参考下图(网上找的)
坐标轴
关于坐标轴,作者提到了几个注意点,怎样判断一个坐标轴是否合理:
- 是否展现出了足够的差别
- 它的范围是否大于数据序列的4倍标准差。
关于4倍标准差这个点,我是没有注意过,这里的为了设置坐标轴范围,让它更合理,使用Excel中的函数STDEV.P()
网格线
网格线的意义到底是什么?这个问题的确没有认真思考过,我想就是为了更方便的找到对应的数据值吧,如果已经标注了数据标签,就可以不要网格线
辅助线
Excel中可以很方便的插入趋势线,主要用来辅助判断数据变动趋势
还有一些类似涨跌线、垂直线、误差线等,还有标注线。
线性趋势线实质上就是一条一元一次的线性回归方程,它表示两组数据间的线性关系,即“随着一个变量的增长,另一个变量怎么变?”
不是所有的趋势线都是有意义的,不能单看回归公式,还要看R方值是否够大,一般只有在R的平方值大于0.6的时候,才认为回归公式是有意义的,代表了回归公式对现实数据的可解释度。
如:R平方值是0.0184,表示两组数据间的关系只有1.8%的信息可以用回归公式来解释。
作者这里提到了一个例子,我感觉挺好的,就是增加均值线和均值加减一个标准差的线,这样可以看出波动的情况是否正常。