14篇文章 · 22422字 · 3人关注
这是在滴滴内部混沌说meetup上分享的内容《DEV和SRE的换位思考》的上篇,欢迎交流探讨转载自我自己的公众号:https://mp.weix...
这里所谓的中小公司,是我的个人定义,服务器数量在5000以下的公司。大公司通常都已经走上了这条路,应该不会看我这篇文章了:) 运维平台收益 先说...
很多三四年工作经验的同学,因为缺少必要的职业素养的培训,工作的方式方法或多或少存在一些问题,这影响了自身的职业发展。怎么做才算是会工作,这里有几...
丑话说前头 先跟研发leader沟通,灌输运维理念,丑话说在前头,我们不做保姆式运维,我们会致力于线上服务安全、稳定、低成本、快速迭代,从运维视...
细心的读者可能会发现,上一篇《运维的价值和目标拆解》中有个脑图,其中监控完备这部分是没有展开的。那么对于一个互联网公司,要对哪些方面做了监控,才...
这里说的运维主要是指应用运维,非系统部的偏硬件和网络的运维 我不幸福 很多运维同学感觉自己很苦逼,感觉每天都在救火,给研发擦屁股,做一些重复工作...
在读《SRE - Google运维解密》的时候看到Google提出的错误预算上线机制,觉得不错,在这里细化一下,如果你们公司线上变更老是出问题,...
之前对Open-Falcon做的两个分享,懒得摘过来了,把链接放在这里备忘 Open-Falcon编写的整个脑洞历程 Open-Falcon应对...
文集作者