工程事故与现实世界(续)

接上一篇《工程事故与现实世界》,继续分享一些现实中的工程事故,以及其中带来的启示。

关键报警

1979 年 3 月,美国宾夕法尼亚州三里岛核电站发生泄漏,20 英里范围内的居民全部撤离,从此以后美国放弃了核电站建设。

事故发生时,反应堆容器发生压力积聚,在这种情况下,正常的应对方案是打开一个安全阀门,降低压力到安全水平。这个安全阀门的设计是通过加电压到电磁制动器上使其打开,打开后会有一个监控指示灯亮起,降压后重新关上阀门,指示灯就会熄灭。

操作人员在压力聚集后按正常处理流程进行了阀门打开降压操作,压力下来后,操作人员移除电压,阀门应该关闭,但实际上阀门被卡在了打开位置,而此时的监控指示灯却熄灭了,操作人员误以为阀门已正常关闭,实际却并没有关上。

之后,反应堆容器中的冷却剂一直泄漏了近 2 小时,直到反应堆顶部从冷却液中暴露出来,燃料棒和芯块开始融毁,在随后的仓皇失措中,轮班人员一直相信控制面板上的指示灯,认为人工减压阀处于正常的关闭状态。

就是这样一个小小的报警指示灯故障,导致了这次核事故。对于像核反应堆阀门这样的关键系统部件,其工作状态需要更准确的监控报警,甚至多重监控报警进行交叉验证。比如:除了电路传感的指示灯报警,还应该有更直接的开闭位置传感报警。

三里岛核事故带来的启示是:对于系统中的核心关键节点,需要绝对直接而且准确的监控报警,报警本身就需要高可用,而且还能多重交叉验证。

忽略变化

20 世纪 50 年代,英国哈维兰公司开发出了第一个商用喷气式飞机,但后来该机型在同一年连续两次出现坠毁。

后经事故调查研究找到了原因:喷气式飞机因为比其他机型飞行高度更高,在飞机起飞和着陆时为使乘客不至于感到不适,不可避免要进行机内空气加压和减压循环;而在喷气式飞机出现之前的机型因为飞行高度低,不需要做加压和减压循环处理;当时的飞机设计人员没人想到这会有什么影响。

但反复的空气加压和减压循环,导致飞机顶部天窗用以发射无线电的铆钉处金属疲劳,产生应力老化裂纹,多次加减压循环后,裂纹扩大变成了裂缝,最终在某次飞行过程中导致了空中解体。在飞机实验室的压力测试环境下并没有真实的模仿实际的加压和减压周期,工程师对自己设计的可靠性陷入了一种错误的认识之中。

更可怕的是,在第一次坠机事故后,并没有找到这个真正的原因,以为是一次意外偶然事件。在该机型停飞了两个月后,由英国首相丘吉尔和该公司总裁联合做出保证不会再出事,数周后该公司的另一架由罗马飞往开罗的班机又坠毁于地中海后,工程师们才找到真正的原因。

在我们做系统时,有一些变化发生了,可能只是我们没有注意到;还有一些变化可能并不常发生,它只在特定的异常下发生。互联网应用的很多在线系统,大部分时候流量压力是逐步积累的,但在特定的情形下也可能会发生剧烈的变化。同样一个量级的流量,是逐步达到的,还是突然剧烈产生的,对系统带来的压力并不一样。

比如,在做 IM 系统时,有一种场景是如果出现集中网络闪断,那么所有 IM 客户端的长连接都会一起断开,并集中重连。这时负载均衡极有可能会让突发的集中重连流量全部打到后端第一个被轮询到的机器上,单机就会被突发的集中流量击垮。而如果是逐步提升的流量,则会均匀的被均衡到后端所有的分布式服务器上。

设计时,尽力考虑所有可能的使用场景变化,而哈维兰的教训实在太深刻与悲痛了。

蠕变效应

2006 年,波士顿的一个隧道内,有 4 块天花板,每块重 3 吨,突然脱落掉了下来,砸中了行驶中的小车。

那么问题来了,天花板为什么会突然坍塌,而之前却毫无征兆?它们是如何固定的?天花板是由金属支架支撑,支架使用螺栓插入钻孔固定在隧道顶部,而螺栓则使用环氧树脂胶填充螺栓和孔腔之间的间隙。

环氧树脂是一种聚合物,其硬度会随时间和温度的变化而变化,如果突然施加一个负载,环氧树脂能在短时间内很好的保持原来的形状。但如果其持续承受负载(静态负载),聚合物的分子可能会慢慢移动,造成环氧树脂逐渐变形,这个过程就是 “蠕变”。

而隧道中使用的环氧树脂具有很差的抗蠕变性,负责安装的工程师忽略了这个事实,也可能是对此缺乏了解,因此造成了这次事故。

而程序系统中类似 “蠕变效应” 的问题有很多,比如:磁盘日志,缓存空间,内存回收,数据存储,索引周期。所有这些都可能因为足够长时间的系统运行,造成 “蠕变” 积聚,直到撑不住引发事故。

系统中没有所谓的抗 “蠕变” 组件,因此我们需要对这些可能发生 “蠕变” 的地方进行周期性的检查,并及时处理。

...

以上就是我这次双十一前读到的一些关于现实世界更传统的工程事故,以及带给我的启示。泰坦尼克号号称当时世界上最安全的船,在撞上冰山之后,回过头来一看到处都是显而易见的问题。俄国作家费奥多·陀思妥耶夫斯基曾说过一句名言:

当失败时,似乎一切都显得愚蠢。

现实世界的工程事故会显得更残酷,不免感慨工程师真要有敬畏之心,能修复缺陷,解决问题固然不错,但能提前去规避和发现会更好。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,980评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,178评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,868评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,498评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,492评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,521评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,910评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,569评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,793评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,559评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,639评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,342评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,931评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,904评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,144评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,833评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,350评论 2 342

推荐阅读更多精彩内容

  • 专业考题类型管理运行工作负责人一般作业考题内容选项A选项B选项C选项D选项E选项F正确答案 变电单选GYSZ本规程...
    小白兔去钓鱼阅读 8,970评论 0 13
  • 1、若一段代码前有异常抛出,并且这个异常没有被捕获,这段代码将产生编译时错误:无法访问的语句 2、若一段代码前有异...
    杰哥长得帅阅读 4,623评论 0 1
  • 有时候, 我表面看上去嘻嘻哈哈, 其实那是在掩饰内心的悲伤。 不想把心情写在脸上, 所以才会一直伪装。 生活中有太...
    t踏雪x阅读 358评论 0 1
  • 货币流通 货币之所以有价值就是因为它能够流通,因为只有流通起来的货币,才能促进经济的增长,没有货币的流通,经济就只...
    enuola阅读 471评论 0 0
  • 女人,有了委屈,不要去找男人诉苦, 倘若他懂你,会自己过来安慰你; 女人,有了难题,不要去找男人帮助, 尽量自己解...
    别我阅读 304评论 0 0