各个系统里边都有自己整治人的办法,不知道私企里边是怎么做的。
但是放在我们系统里边,那个令人闻风丧胆的名称叫做——归零。
我们以电视机为例,比如说屏幕花白,不显示信号。那这原因在哪里呢?假设你是这款产品,我们
姑且命名为LZ-1号,也就是兰州一号的设计师。当生产线上整个一个批次的电视机出现了这个问题,而各方逼你逼的又非常之紧,限期解决问题,你怎么向下推动呢?
要知道,你可是上有老下有小的。本次事故重大,直接影响到全厂的收入。要是你作为设计师,解
决不了,最轻,你也得要引咎辞职的。
各方压力都很大,你不一定有办法。不过,领导们总是充满智慧的,每当此时,他们都会十指交叉,
支撑在下巴上,在万众瞩目的大会上沉思片刻后,优雅的吐出三个字——“归零吧。”然后潇洒的
散会。
归零,什么东东?且慢,领导,解释清楚啊。高数里边学过归一,每每想不通的时候,我也想过要
皈依,不过,归零...?
好在有我。稍安勿躁,姑且让已经见过不少归零的小萌萌同学跟你讲讲。
其实,归零的目的也就是把导致问题发生的原因找出来,此事常常被人们形象的描述为抓贼,犯了案
,第一步是找嫌疑犯,嫌疑犯只是嫌疑,火眼金睛,把真正的贼找出来才是真本事。
不同的侦探有不同的方法,毕竟不是每个人都是福尔摩斯。
好在,航天系统为年轻的工程师们提供了一套简单可操作的方法,只要是正常文化水平的人,都可以按部就班的按照进行操作。呈现在你眼前的,实际上只是一个装在表格中的流程而已。
首先,简单的描述问题发生的经过。也就是什么时间、什么地方、什么人参与时发生了什么事情。对
应到我们的具体案例,就是xx年xx月xx日,在我所的xx生产线上出现了批次性电视机屏幕花白无信号
的情况。这里,只需客观简略的描述问题即可,不应多做陈述。
其次是几个小框,以5M1E的方法将这个问题加以定位,所谓的5M1E,也就是人们所熟知的人、机、料法、环、测。电视机出现花白怎么定位?人的因素,可能有。机器的因素,可能有。料的因素,我们加以严格控制了,而且能够提供大量的证据来论证其合格性,不做考虑。环?不太可能,到时候查温、湿、洁净度即可,不过,作为一个以报告形式提交上去的东西,可以做保留,充实一下资料的完整性。测,是指测试方法,英文是Method,5个M中的一个。测试,涉及到跨部门之间的问题,谨慎为好,不过不能不提。确定了吧,在对应的小框当中划上“√”吧。
再次,是整个以归零报告形式呈现的核心部分——故障树。也是体现出一个工程师水平高低的地方。好的工程师能把这个地方讲的合情合理、逻辑分明、引人入胜。差的工程师,轻重不分、逻辑混乱、听得人昏昏欲睡。
说树本身,既然是树,所以就有枝和根。不同的是,我们这棵树,是倒长的。根在上,枝在下。根所在的位置,画一个方框,称之为顶事件,也就是我们待分析的故障,本文中,在框中填上“屏幕花白无信号”几个大字。宋体五号即可。
之后往下分,长出几个干来,假设你推测出有四种可能导致该故障出现的原因,那往对应的框里边填,如“显象管故障”、“磁偏转器位形异常”、“PCB版阻抗下降”、“信号传输通路阻塞”,这四项都是我瞎掰的,仅作讲解用。树的第二层写的都应该是导致故障出现一些可能性,无须细化至事件级别。
第三层是我们需要去依次排查的可能原因,也就是那个贼。体现在故障树中,是从各个干上长出来的枝,可以非常多。你愿意的话,可以把自己想到的所有可能的事件都罗列上去。比如显象管故障一条下,我们可以写“电子发射性能衰退”、“杂质气体放电”、“设计间距临界”等等。在“磁偏转器位形异常”下可以写“磁极装配反向”、“磁靴多余物沉积”、“磁极高温消磁”等等,依此类推。这些属于故障树枝干的项目上,你应该标号,一般是用X1、X2、X3等等来进行标记,直至排序完毕,比如说你写了总共十四条,那么最后就是到X14。当然也可以到X15等等之类,关于这点,未有强行规定。
完成这一步后,往下推动,就是利用各种方式、各种证据来排除其中所有不可能的事件,只剩一项。如果是14项,那你需要排除的,就是13项。方法,是利用各种试验、测量、比对以及其它任何一种令人信服的方法。读过大物理学家费曼写的NASA邀请他参与挑战号飞机失事原因调查的故事么?他就是用试验方法做了佐证,把一个O形橡胶圈放置在冰水中10分钟后,拿出来,O型橡胶圈失去弹性,完全变形。正是这导致来燃料的泄露,挑战号爆炸。更令人遗憾的是,伴随着宇航员生命的丧失。
这里,我不做展开陈述,如果你正好是阅读到这篇文章的人,想必一定不缺乏智慧。一定是能够想出各种各样办法来解决排除那些嫌疑犯的。当然,这个过程也是最痛苦以及最快乐的部分。
如果你轻而易举的排除了故障树上被我们称之为底事件的枝的话,你一定天资过人,更重要的是,你接近于解决问题了。
可接近于,不等于解决。领导们作为决定你的发展和薪酬的人来说,是万万不能忽悠的。要令他们满意,你还有一步工作要做——问题复现。
既然你说你找到了问题的原因,好的,正好这里有一台电视机,也是以前从这条生产线上下来的,不过,是好的。来吧,把屏幕花白无信号的现象在这台电视机上重复一遍。为了不冤枉你,我开一下机,看到彩色电视经典的待机界面了吧?产品是好的,那么,做故障复现吧。他的言下之意是,是骡子是马,拉出来溜溜。
你凝神屏气,在脑海中又一次过了一遍自己的问题排除过程。确认无误了,跟身边的师傅使个眼色,换!
接着,师傅迅速的把提前准备好的和故障产品同批次的显象管换上电视,接电、开机。果然,屏幕一片花白,无信号。旁边好心的同事压抑不住喜悦,开心的笑了起来。你看着领导,心里压着的石头终于落了地。领导还是一副高深莫测的样子,不过,你似乎能够看到他内心的喜悦。“小伙子,行啊。”
实际上最后还有一个机理分析部分,不过,在做产品的厂所里边,并不很重视这个。很多产品,机理根本不清楚,做成4mm大小的未必有问题,但是当你把它扩大十倍,变成40mm时,问题多多。只能先做后试,或者边做边试。像是爱丁顿去赤道附近观测爱因斯坦广义相对论预测的光走曲线的例子,似乎不多。
归零是做产品的人最不愿意遇上的事情,然而又不得不遇上。没遇上,暗自庆幸,从自己的手里顺利的走了一个产品。遇上了,只得认命,做产品的可能性本来就巨多,任你做再多的风险分析,卡质量卡得再严,遇上事,也只能说是你和归零有缘份。
也有豪情万丈的。
我们科室有一位老前辈,在我们的发展期中贡献甚大。做和我们产品相关的一个重要子系统时,归了无数零,弄得北京总体单位都乐了,说怎么又是你来归零?而我们的老前辈,愈战愈勇,回来之后,说,归,继续归!
哪怕再来100个归零也统统给归!
反之,是经常能够在中国航天几个蓝色大字映衬的院子里透气的加班的年轻人们,每每遇到,打个招呼,寒暄两句后,自嘲一句,“没有归过零的人生是不完整的人生...”
总之不管承认不承认,归零,已经成为航天人人生中不可忽略的一部分。
借用一句流行诗句来结束本文,“零,不管你归于不归,它就在那里,不离不弃。”(哎呀妈,这篇话题好沉重,可累死小萌萌同学了。)