一、数据分析类别
描述性分析一般包括:对比分析法、平均分析法、交叉分析法;
探索性及验证性数据分析:相关分析、因子分析、回归分析等等。
二、菜鸟与数据分析师的区别
小白:菜鸟目的不准确,很迷茫,喜欢追求高级的数据分析方法。而数据分析师的目的就很明确,一切都以解决问题为中心。
Mr.林:说得好!其实他们最主要的区别就在于目的是否明确,如果目的明确,所有问题就自然迎刃而解了。例如,分析师是不会考虑“需要多少张图表”这样的问题的,而是思考这个图表是否有效表达了观点?如果没有,需要怎样调整?如果目的不明确,菜鸟自然会在用什么样的分析方法、作多少张图表、需要多少文字说明、报告要写多少页等这些问题上纠结。
三、数据分析师的基本素质
1、态度严谨客观
2、好奇心强烈
3、逻辑思维清晰
4、善于模仿
5、善于创新
四、数据分析六步曲
1、明确分析目的及内容
在开展数据分析之前,需要想想为什么要开展数据分析?通过这次数据分析我要解决什么问题?只有明确数据分析的目的,才不会偏离方向,否则得出的数据分析结果不仅没有指导意义,甚至可能将决策者引入歧途,后果严重。
当分析目的明确后,就需要把它分解成若干个不同的分析要点,也就是说要达到这个目的,需要从哪几方面、哪几个点进行分析,而这几点就是我们需要分析的内容。只有明确了分析目的,分析内容才能跟着确定下来。
2、数据获取
数据库
公开出版物:《中国统计年鉴》《中国社会统计年鉴》《中国人口统计年鉴》《世界经济年鉴》《世界发展报告》 《各类数据分析报告》
互联网
市场调查
3、数据处理
4、数据分析(决定用什么方法,如初级的描述性分析、统计分析、数据挖掘等)
5、数据展示(可视化)
常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等,当然可以对这些图表进一步整理加工,使之变为我们所需要的图形,例如金字塔图、矩阵图、漏斗图、帕雷托图等。
6、数据报告撰写
一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
另外,数据分析报告需要有明确的结论,没有明确结论的分析称不上分析,同时也失去了报告的意义,因为我们最初就是为寻找或者求证一个结论才进行分析的,所以千万不要舍本求末。
最后,好的分析报告一定要有建议或解决方案,作为决策者,需要的不仅仅是找出问题,更重要的是建议或解决方案,以便他们在决策时作参考。所以,数据分析师不光需要掌握数据分析方法,而且还要了解和熟悉业务,这样才能根据发现的业务问题,提出具有可行性的建议或解决方案。下面的图1-6示范了一个分析报告的基本框架。
五、数据分析的几个常用指标
1、平均数
2、绝对数/相对数
绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,也是数据分析中常用的指标,如GDP、总人口等。此外,绝对数也可以表现为在一定时间、地点条件下数量的增减变化,比如“A”国人口比“B”国人口多1000万人。
相对数是指由两个有联系的指标对比计算而得到的数值,它是用以反映客观现象之间数量联系程度的综合指标。计算相对数的基本公式是:
相对数=比较数值(比数)/基础数值(基数)
分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称
比数。相对数一般以倍数、成数、百分数等表示,它反映了客观现象之间数量联系的程度。
使用相对数时需要注意指标的可比性,同时要与总量指标(绝对数)结合使用。下面
3、百分比和百分点
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。例如,图1-10中某公司发言人就混淆了百分比与百分点的概念。表示构成的变动幅度不宜用百分数,而应该用百分点。因此,这位公司发言人正确的说法应该是“公司今年的利润是45%,比去年的28%提高了17个百分点”。
4、频数和频率
频率是每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。还是用某校A班的例子,30个男同学(频数为30)在50个同学中出现的频率为60%,即(30÷50)X100%;而20个女同学(频数为20)在50个同学中出现的频率为40%,即(20÷50)X100%。
所以,频数是绝对数,频率是相对数。
5、比例和比率
比例与比率都属于相对数。
比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。比如,A班共有学生50人,男生30人,女生20人,则男生的比例是30/50,女生的比例是20/50。由此可以看出,比例的基数(也就是分母)都是全体学生人数,即为同一个基数。
比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。比如刚才的例子,男生30人,女生20人,则男生与女生的比率是30/20,如图1-12所示。这一指标经常会用在社会经济领域,比如我国的人口性别比就是用每100名女性数量相对的男性数量来表示的。
6、倍数和番数
7、同比和环比
同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。例如2010年12月与2009年12月。
环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。例如2010年12月与2010年11月相比