报表任务治理计划

背景介绍

近些年来,大数据技术得到了很广的应用,支撑了业务的快速发展。作为大数据的平台部门,提供了大数据相关的基础能力,业务同学借助于大数据的底层赋能完成更偏向业务的需求开发。报表是大数据支撑最早最广的功能形态。先给大家介绍我们我们公司的报表产出组件图:


报表产出图
  1. 底层平台由HDFS、Yarn分别提供存储和计算支持
  2. 在这之上我们提供了一套支持MR、Spark任务开发、依赖执行的调度系统
  3. BI业务同学利用调度系统完BI任务的开发,最终这些BI任务完成后会把数据写到Hive中
  4. Tableau报表系统定时从Hive中读取数据完成报表的渲染

问题

平台部门的目标就是保证报表的按时产出,公司高层可以根据产出的报表进行决策和资源的合理分配。
接下来我们看看报表的稳定性面临哪些问题,哪些系统的会最终造成报表产出,让我们看一份大图。


报表全程图

tableau报表处于整个数据应用的最上层,下面依赖的数据源、数据仓库、调度任务任何一个环节延迟都会导致整个报表的产出延迟,我们来细分下

数据源
  1. 业务表计算延迟
  2. 数据同步任务本身缺陷
  3. 业务库字段变更,同步出错
数据仓库
  1. 数仓任务调度延迟
  2. 数据计算逻辑错误
  3. 数据量增大,数据计算产出时间变长
  4. 上游依赖变更,数据错误
调度系统
  1. yarn资源不足,大量任务等待
  2. 报表新增依赖,下游调度任务开始时间变慢
  3. 无用任务占用太多资源
  4. 用户使用不规范
  5. 大数据平台本身故障
  6. 误操作
  7. 不合理的上游依赖
Tableau
  1. 用户密码变换
  2. 队列资源不足
  3. 部门间任务相互影响,一个部门的超时任务会影响其他部门的

治理思路

上面的任务按照责任主体划分可以分为业务方和平台方。比如业务SQL逻辑错误、依赖新增等属于平台方责任,而队列资源设置不合理、平台工具逻辑错误、公共数仓产出延迟、集群变更导致延迟属于平台方问题。

  1. 大数据的思路治理大数据。分部门统计资源消耗量、报表数、错误报表数,数据透明清晰,便于沟通
  2. 驱动用户自运营。也可以从两方面考虑,一方面是一些给用户带来满足的手段,比如部门质量排名情况。一方面是恐惧的压力:限制最大资源数、最大报表数量
  3. 平台提供工具,报表的产出的准点负责方应该是业务方。

怎么做

我准备分三部分来介绍我们的方案,分别是问题预防、问题诊断、问题快修复。

问题预防

  1. 业务SQL修改后必须试跑成功后才能上线
  2. 依赖部门外任务必须要上游同学审批同意
  3. 用户名密码改编后及时知会用户修改相应的报表配置信息
  4. 核心报表的产出时间延迟趋势监控
  5. 复杂度、部门总体运行情况查看
  6. 队列划分合理,避免不同业务优先级之间相互影响

问题诊断

  1. 系统监控。监控整体的任务的整点的成功率、超时失败任务数
  2. 细粒度监控。提供功能让用户能针对高优先级的报表进行监控

问题快修复

  1. 统一地方查看报表延迟在哪一个环节
  2. 提供工具快速完成问题修复
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,723评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,080评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,604评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,440评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,431评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,499评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,893评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,541评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,751评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,547评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,619评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,320评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,890评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,896评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,137评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,796评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,335评论 2 342

推荐阅读更多精彩内容