时间序列分析 - 基础知识与分析场景(Time series analysis)

在所有的可视化仪表板中,和时间相关的图表是最常见的。除了最基本的折线图外,我们还有很多方式来呈现和分析时间序列的数据。

时间序列的模式(Time series patterns)

在开始探查分析前,我们需要先确定时间序列的模式。

常见的模式有:

  • 趋势性(Trend):数据随时间变化的呈整体上升或下降的趋势。
  • 季节性(Seasonal):数据在每年的特定季度、月份、周、日的数据波动。
  • 周期性(Cyclic)数据存在不固定频率的上升和下降时,表示该序列有周期性,通常与商业活动有关。

很多时候时间序列会同时包含趋势、季节以及周期性。

image.png

美国新建房屋销售额表现出强烈的年度季节性,以及周期为6~10年的周期性。同时数据并没有表现出明显的趋势性。

image.png

柏林的游客数据同时包含了趋势性季节性,即总的游客数量是稳步上升的,同时又有明显的季节性。

image.png

为了更清楚的看到季节性的分布,我们可以将多年的数据对齐到以月的方式查看。

时间的粒度/级别

不借助外部仪器,人类的极限反应速度可以到100毫秒。在科学分析场景,如物理学,时间精度可以更高。在商业分析场景,一般拿到的数据粒度会以:年、季度、月、周、日、小时 居多。细粒度的时间可以向上聚合到粗粒度的,比如:拿到的是去年每一天的销售额数据,但作为年度的总结,只要看每个月的销售额即可。

时间的连续与离散

连续的时间:

等间距,一个接一个的。如3月1日、3月2日、3月3日、一直到 3月15日每天的数据。如果缺了某几天的数据,在时间轴上仍然会保留对应的位置。

image.png

离散/序数的时间:

假设我们想看一周中每天的销售表现,这时可以从连续的时间中,提取出离散的周几时间来进行分析。

image.png

在具体分析时,我们一般还会区分下工作日与周末,并分别看平均值。

image.png

带着问题去分析

当前相比过去的变化

总结过去,展望未来。我们总是希望知道当前相比过去的变化。

image.png

以各个地区在过去几年销售额的变化为例,我们可以看到6个地区详细到每个月的销售额数据,但当我们想知道相比过去是否有增长或哪个地区的增长最快时,就没法看清了。

image.png

这个时候,可以通过斜率图(slopegraphs)来更好的分析与呈现,具体做法是只保留头尾时间的数据,然后用折线图来呈现,为了更容易发现上升下降,还可以用颜色来区分。

某个时间点前后的比较

从假设分析(What-If Analysis)的角度,我们会关心如果在某个时间点做了某个行动所带来的收益。

以买房为例,我们会关心如果我在某个时间点买了房,那么截止到当前的涨幅变化,以及相比更早的时间的变化。

image.png

image.png

这个是纽约的房价变化图,如果在2012年买入,那么到了2017时,会有21%的涨幅。而如果是在2006年的高点购入,则只有6%的涨幅。在做这样的假设分析时,我们一般会允许用户指定时间参数,以更灵活的分析前后的变化。

如何查看排名变化

相比过程本身,人们更容易关注结果。

image.png
image.png

假设我们有不同类别的商品在销售,每年的销售额稳步上升,除了关心具体的收入外,我们还想知道各个类别的排名变化。如果通过颜色来细分各个类别的销售额,虽然也可以看出一些排名变化,但还是会不直观。

image.png

image.png

这时我们可以先计算每年的销售额排名,然后用排名变化图(Bump Chart)来呈现。相比销售额随时间的大幅波动,排名变化图可以让你更好的聚焦于关心的点。

不同事件的增长速度

以玩具总动员三部曲为例,这3部电影发行于不同的年份,也都获得了很高的收入。

image.png

如果只看累计的票房收入,我们可以知道第二部的表现最好。但如果我们想知道这几部电影从首映日开始的增长变化或火爆程度就没法看出了。

image.png

从这个图上我们可以按周看发生在不同年份的,三部曲的每周票房收入。

image.png

更好的方式把时间对齐到一个公共基准点来查看分析,而不是查看一段绝对时间范围的数据。按星期看自首映日开始的总收入,就更容易比较增长曲线了。

如何分析事件的持续时间

在项目管理的场景,一个项目会拆分为多个可以并行或有前后依赖关系的任务。

image.png

为了查看总的用时,以及同时进行的任务,我们可以用甘特图(Gantt charts)来呈现和分析。这儿的205天是整个项目的用时。如果要算人天成本,可以把这儿的每个任务的用时加起来,即投入了4个人,总的人天是:292。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342