数据集犹如世界历史状态的快照,能帮助我们捕捉不断变化的事物,而数据可视化则是将复杂数据以简单的形式展示给用户的良好手段(或媒介)。:从业务与数据出发,经过数据分析与可视化形成报告,再跟踪业务调整回到业务,是个经典闭环。
我们的可视化是为读者进行的,我们应考虑目标读者的特点制作他们易于、乐于理解的可视化。尤其要避免的一个陷阱是:过分追求新颖图表,反而使得图表难以理解,结果违背了可视化的初衷。
让我们的报告以讲故事的方式展开,我们自身则作为这个报告的导游,合理有效地引导读者看完你创造的“分析故事”。
一、图表的基本组成元素
一张图表至少包含:标题、横纵坐标轴、数据系列、数据标签、图例等部分,每一部分都在图表中扮演特定的角色表达特定的信息。当然这些元素并不是必须具备的,当信息足够清晰时,你可以精简部分元素,使得图表更加简洁。
图表标题一半使用粗体,不换行显示,为图标的大纲,一眼能看出图表展示的是什么含义。
脚注标记数据来源,体现专业性与严谨性。
二、图表的选择
绘制图表的第一要素就是,分析数据适合使用什么图表。Excel中的基础图表有非常多,但是必学的可以分为以下这10种:柱状图、条形图、散点图、气泡图、雷达图、饼图、折线图、面积图、直方图、组合图等。在不同的数据结构下选择不同的图表,会有不同的效果。
1. 折线图“家族”
折线图的核心思想是 趋势变化。
作为信息最明了的图表,是各种图表中最容易解读的图表,以下是它的几种变种:
▫基础折线图
▫堆积面积图
折线图小结
1)折线图是点、线连在一起的图表,可反映事物的发展趋势和分布情况;
2.)适合在单个数据点不那么重要的情况下表现变化趋势、增长幅度。
2. 柱形图“家族”
柱形图的核心思想是 对比
▫累加柱形图
适合少量类别的对比,且对比信息特别清晰
与堆积面积图相比,堆积面积图比累加柱形图多一时间维度,它可表达时间维度上的趋势变化。
▫多指标柱形图
主要运用于多个指标进行对比分析的场景,但类别对象不宜过多,当超过5个,不适合使用此图表
技巧:当各对比指标大小相差10倍甚至更大时,可采用标准化,如:对数值取自然对数,既能有效缩小指标量度差距,也能保留同指标的大小关系
▫条形图
当对比对象类别>5时,将多指标柱形图更改为单指标的条形图,能有效提高数据对比清晰度
条形图,必须按照数值大小降序排列,这是提升条形图阅读体验的重要手段
▫瀑布图
核心是按维度/指标下钻分解,如:公司收入各用途分解、公司年利润按分公司分解、业绩按销售团队分解;
对比饼图的优势在于,拆解项较多时,瀑布图通过数字的标记仍可清洗辨别,而饼图在分解项>5时就不易辨别。
▫柱形图结合折线图
对比多个指标,尤其是对比指标与指标的增长率上非常适用,使得一个图表可以表现两个层次的信息。(当然要尽可能避免信息的重复。如下图,折线图含义如果换成团队签约数占公司总签约数比例,则意义不大)
使用双坐标轴,要表明清晰
柱形图小结
1) 核心是对比,柱形图的目的是将对比信息放大,直观呈现出来;
2) 由于直观,柱形图适合做结论的表达;
3) 柱形图一般不用在时间维度的变化;
4) 柱形图的数据系列和点不宜过多,否则建议改变图表形式;
5) 柱形之间的宽度尽量小于柱形本身的宽度。
3. 散点图“家族”
散点图的核心思想是 研究
研究型图表,适合用于发现变量间的关系与规律,不适合用于清晰表达信息的场景
▫基础散点图
▫气泡图
在基础散点图上添加一个维度:用气泡大小表示新的一个维度
下图中,气泡大小表示配送费用
散点图小结
1) 散点图作为研究型图表,经常在数据分析前期被使用,在报告中很少见;
2)散点图不够直观,大多时候不能直接表达结论;
3)散点图对于业务敏感度和数据意识要求较高;
4)散点图只是入门的钥匙,发现规律只是分析的切入口。
4. 饼图“家族”
饼图的核心思想是 分解
▫基础饼图
技巧:将需要突出显示的部分,置于左上角,顺时针方向
▫旭日图
旭日图在基础饼图上可表达更多层次的分解关系,如下图:有季度分解、月度分解、再到每周,且每个维度之间可兼容包含
饼图小结
1) 一般来说,数值最大的部分排在最前面,也就是12点钟方向顺时针;
2) 饼图的细分项不宜过多,一般不超过8项;
3) 不要制作三维的饼图,不直观;
4) 切忌将饼图拉得过开,若要突出某一块,可单独将其拉开。
其实,个人觉得饼图在实际场景中应当尽可能少的使用(因人眼对面积大小不敏感),而且对指标的分解柱形图同样能胜任,且远远清晰于饼图。
当且仅当,用于反应单个模块占整体比重时,适合用饼图
三、Tableau可视化图表制作
1. 树状图(TreeMap)
主要功能用于可视化整体与部分关系,以区块表示部分层级(不同区块用颜色区分),用矩形面积表示大小关系。
缺点:以面积表示大小,当数值相近时人眼难以辨别,当然可通过填充数值弥补。
2. 漏斗图(FunnelPlot)
适用于关键业务环节数据比较,将各环节串联起来构成漏斗,量化流程内环节,追踪各环节转化率。转化是漏斗图主要表达信息。
1. 电商类:访问 -> 注册 -> 购物车 -> 下单 -> 付款;
2. 营销推广:展现 -> 点击 -> 访问 -> 咨询 -> 下单 -> 付款;
3. CRM:潜在客户阶段 -> 意向客户阶段 -> 谈判阶段 -> 成交签约。
以上只是常见漏斗,实际各种业务流程都可构建漏斗。
缺点
漏斗图在实际分析中并不常见,但在PPT中用作信息描述却明显优于干巴巴的数字
1. 追踪流程较困难,而企业是结果导向的,我们更在意整个流程的转化率,有时不会深究细节;
2. 有时候我们更关心某环节转化率在时间维度上的变化。
3. 桑基图(Sankey diagram)
桑基图,即桑基能量分流图,也叫桑基能量平衡图。
起源
1898年Matthew Henry Phineas Riall Sankey绘制的“蒸汽机的能源效率图”而闻名世界,此后便以其名字命名为“桑基图”。
应用场景
1. 展示分类维度间的相关性,以流的形式呈现同一类别的元素数量;
2. 表示集群的发展,比如特定人群的分布,如:杏仁活跃医生在一段时间的活跃状态变迁;
3. 具有流程图的性质,表示能量/物质流转。
核心特征
最明显的特征是始末端的分支宽度总各相等,即所有主支宽度的总和应与所有分出去的分支宽度的总和相等,保持能量的平衡。
参考资料