事件管理是为应用程序提供助力的关键要素。
在打造应用程序时,我们把绝大部分时间都投入于应用程序发布到生产环境的过程中,包括规划蓝图、识别客户需求和要求以及构建自身底蕴和特性。然后是不断循环的开发、测试和质量管理。同时,工程团队也在协同工作,准备环境。之后,这个应用程序终于面世了,我们转而开发另一个应用程序。此时,运营团队担起运营已发布应用的责任。如果这就是应用程序的互动终点,开发团队就错过了大量极具价值的改进反馈。这个时候,事件管理流程就可以发挥关键作用,帮助改进应用程序并最终实现更出色的用户体验。
1. 按需提高升级速度,缩短问题解决时间
有了界限分明、使用得当的事件管理流程,应用支持自然而然地成为企业文化的一部分。解决事件的时间缩短了,解决方式也更有规律,往往更贴近最佳实践。如果事件管理没有详细记录或使用不熟练,会导致不断尝试解决问题但始终灭火无门。
2. 鼓励轮岗培训
根据「我宁愿其他人半夜起床解决问题」这一原则,事件管理流程鼓励开发团队内部和各个团队之间进行轮岗培训。这一措施的附加好处是,可以促进操作文档和配置管理实时更新,同时强调代码和注释易读性的重要性。
3. 营造信任透明的文化
开发团队的所有成员都应同时以候补人员和主要人员的身份参加升级轮班。这可以推动形成以沟通和团队情感为基础的既得利益。此外,由于事件管理促进了透明度,值班工程师对应用程序的了解会更加深入,从而缩短解决问题的时间。如果团队遵循微服务典范并确保每个应用程序仅提供一项服务,这一优势会愈发明显。
4. 为初级员工提供成长机会
我们一心向前,却常常忘了回首过去。思维和观念的多样性有助于团队发展。而事件管理流程可以公开应用升级路径中的每个阶段,从而鼓励思维和观念的多样性。事件的解决有助于团队中的初级成员受益,他们不仅可以获取有关特定事件解决方案的宝贵知识,更能了解到应用程序拓扑结构的总体设计。对企业而言,招募人才并留住人才具有重要意义。如果从一级事件响应一直到开发和工程团队都存在明确的路径,将会是极具价值的招聘优势。
5. 优化总体进程
相较于之前的月度或季度部署,持续集成和持续交付实现了更为迅速的部署,从而帮助减少事件的数量和发生频率。同时,我们可以在更短的时间内修复漏洞,大大地减少反复的暂时性修复工作。此外,这也减少了工程和运营团队的累积技术债务,为「按计划进行修复工作」提供了良性途径。
6. 生成量化反馈
我们所跟踪的每个事件都包含大量内容,比如多名成员修复事件耗费的时间、为标注解决方案所创建的文档,可能还包括提交的漏洞报告。在运营应用的过程中,还需要给出痛点评估。这不仅对应用蓝图有所启示,也能促进各方就可实施的高价值简单改良方案展开对话。
7. 开发内部工具
团队达到一定规模之后,就会出现责任分化。这是企业的自然演进,也是继续扩大规模的途径。之前毫不起眼的应用运营工具如今可能是确保企业维持发展的必要手段。事件管理流程的好处,不仅仅是揭示了开发这类工具的需求,更告诉了人们应当从何处入手。
人们通常认为,应用事件管理仅仅是客户支持和客户成功的一部分,而客户也只看到了应用程序中与自己相关的那一部分。事实上,有一条叫做「用户体验」的狭道,贯穿了应用程序的所有层面。应用的韧性越强,解决事件所用的时间越短,客户就能越快地爱上你那出色的应用。「用户体验已经不止是一块敲门砖」
OneAlert 是北京蓝海讯通科技有限公司旗下产品,是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性,让事件管理作用于最佳实践。想了解更多信息,请访问 OneAlert 官网 ,欢迎免费注册体验 。
参考文献:7 Benefits of Incident Management in Supporting Applications
本文转自 OneAPM 官方博客