You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

105 lines
12 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 03 | 看透本质:研发出了生产事故,到底要不要罚钱?
你好,我是乔新亮。“本质”这个词现在已经烂大街了,我看很多的公众号文章,动不动就说本质、底层原理,这也侧面说明我们每个人面对复杂问题时的心态:我们想直击问题的关键点,找到问题背后的本质。
但,你我也都知道,看透本质终归是一件很难的事。昨天我就还遇到一件让我自己头疼的事情,思考很久之后,还是没有找到好的方法。当时,我就扪心自问:我有没有看清楚这件事的本质?
我小声告诉自己:还没有。但就同样这件事情,相比数年前,我有没有进步?我自认进步还是很大的,做决策的成功率也越来越高。
所以,今天我想和你聊聊,我们应该如何看透问题的本质。
## 一项制度引发的思考:研发出了生产事故,要不要罚钱?
如何看透问题本质?这问题对我来说,更像是一项可以通过长期训练而习得的能力。我从很早开始,就试图搞清楚各种问题背后的本质和根源,但印象最深刻的一次实践,始于 2014 年。
从那一年开始,我接手了苏宁集团的“双十一”保障任务。到 2019 年,苏宁大概存在 4000 多套系统、1 万多名研发人员,日高峰发布接近 4000 余次。面对这个庞大的系统,你可以想到,任何一个细小的动作都可能引起研发事故,我要思考的是,怎么保证“双十一”这种大型促销日系统不出问题。
很难。我查了下历年的复盘文档,发现不管前期准备得多么严密,双十一当天总是会有意外发生。
如何保证大型电商企业“双十一”服务的高可用性,这是个高复杂度的系统性问题,在极客时间上已有很多专家给出了答案,但这些解决方案不是我们今天要讨论的重点。今天我们只谈其中一个微小但十分重要的分支:**虽然技术部门准备得十分充分,但线上还是出了事故,要不要针对主要负责人罚钱?**
保守地说,业内起码 90% 的企业都会罚钱。原因很简单,线上出事故,领导认为根本原因是负责人不够认真、不够投入,出了事故就应该承担责任。你看,这个观点里,事故发生,是现象;负责人不够认真,是本质。你是不是觉得逻辑很清晰?
一开始我也是这么做的,并未觉得有什么不妥。直到有一天,团队一个技术负责人找我谈心,他说:“老乔啊,你这制度设计不合理。多做多错,少做少错,不做不错,你这是变相鼓励团队少做事。”
我一愣,觉得这位负责人说得有些道理。因为,对于大促这种高并发的场景,最容易出问题的往往是最核心的模块。相对来说,一个边边角角的简单系统,就不那么容易暴露问题。
试想一下,一个能力很强的人,包揽了团队最重要、最累的工作,结果出了问题反而被罚了 3000 块钱;一些庸才付出得相对较少,一个月安安稳稳的,反而一分钱没扣。这个逻辑显然是有问题。
于是,我对这件事的本质认知开始动摇,但压力也随之出现:出了事故就罚钱,好像不太对劲;但如果不罚钱,那团队是不是就会因此松懈下来?我喜欢看兵法,打了败仗,部队里可是要问责的,这罚钱肯定是问责最直接的方式了。
这时,我意识到,关于“研发事故的处罚措施”这件事,有必要重新思考其背后的本质问题。如果管理者只会罚钱,大概率是在将压力转嫁到一线人员身上。
## 问题本质的追寻之旅
我并不相信一句“多做多错,少做少错”,就能概括问题的全貌,最好还是广开视听,交叉验证一下。
所以,我很快找到公司的 HR 部门聊了聊HR 同学惊讶地说道:“话不能这样说呀!核心部门虽然容易出现事故,压力比较大。但他们的奖金额度高,薪资水平也普遍高于其他部门,升职机会也更大。”
听起来也有道理,好像被处罚的员工也并非单纯的“受害群体”。围绕这个问题继续思考,我很快发现:出了事故就罚钱,这与自己提倡的有些企业文化也是相违背的。
比如,我鼓励“勇于试错”,动不动就罚钱,那谁还敢试错?我提倡“团结紧张严肃活泼”的团队氛围,在这种制度下好像也很难实现;一旦开始罚钱,事故所牵涉的部门就会开始互相推诿,团队协作和氛围就会出现问题,这也不是管理者们希望看到的。
这时候,我停下来,又推演了一下惩罚制度设立的初衷。它不是为了“恶心员工”,克扣工资;而是尽量保证同一个问题不要再犯,或者说,降低犯错的次数。
在大型企业,一个 CTO 级管理者因为位置太高很容易脱离实际的生产情况。如果不做深入观察CTO 可能会气恼地发现IT 部门根本就是不停地犯错!只有当他深入追查问题来源时,才有可能意识到:发生在核心业务上的生产事故,往往涉及多个部门、多个团队,实际情况常是 A 部门刚刚犯错被罚了钱, B 部门又犯错了B 部门被罚钱没多久, C 部门又犯错了……
其根本问题在于A 被罚了钱,并不能让 C 免于犯错,甚至也不能让 A 保证不再犯第二次,反而让所有人胆战心惊。
综合所有了解到的情况,我们很容易就能得出结论:罚钱确实让员工更重视问题了,但并不能在本质上解决问题。
最后,我又换位思考,也问了问自己:“老乔,换做是你自己,你能不能保证 100% 不出事故?”答案当然也是不能,尽管我对自己的工作能力和责任心都很有信心。
至此,我终于得出结论:**生产环境出现事故,与员工的责任心和能力没有绝对因果关系,故而不能靠单一的惩罚条例,其背后本质,是管理者是否能够体系化地解决问题。**
从罚钱到不罚钱,在我眼中,变化的是对问题本质的理解。当然,我也围绕新的认知制定了许多相应的体系化措施,包括:
* 一个事故要有七个改进点:每个改进点保证 100% 不重犯;
* 犯错的人负责牵头落实复盘,分享失败的经验;
* 解决问题的手段产品化,人会犯错,但产品不会犯错;
* 允许每个人犯错、试错;
* 根据事故统计定期颁发“烂草莓奖”和“金苹果奖”;
* 管理产品化、系统化、数据化。
一旦对问题本质形成了新的认知,解决方案就会自然而然地涌现出来。在新制度下,事故系统的当事人不会再受到金钱上的惩处,但很可能会收到“烂草莓奖”,激发团队的荣誉感和责任担当。
到此,我仍然不能确定自己真的抓住了问题的本质,因为所有结论都需要谨慎验证。
所以从苏宁到环球易购,再到彩食鲜,几年间,我围绕新的认知,开始灰度实施“不罚钱”的体系制度,其间不断针对实施效果复盘,看看哪里还能迭代,哪里还能精进。到今天,我可以放心地说,新的认知结合新的制度,确实起到了不俗的效果,极大降低了事故发生率,团队的士气也很好。
## 经验抽离:看透本质这件事,究竟难在哪?
好了,以上就是我在面对“生产环节出现事故,要不要罚钱”这一问题时,探寻本质的过程。其中,我发现有几点对结果尤为关键。
**第一,大胆假设,小心求证。**
探寻问题本质,为的是指导自己进行决策,更好地解决问题。你一定要注意这个前提条件,不能漫无目的地脑洞大开。在此前提下,大胆假设,提出自己的观点自然成为推演的开始。
有了假设,下面就是结合具体情况进行验证,如果基于假设的处理方式和其他一些管理理念有冲突,那说明假设需要完善。直接在金钱维度对下属进行处罚,与许多正确的企业价值观和理想氛围相冲突,这是我进行再思考的重要依据。
**第****二****,刻意练习自己的思辨能力。**
日常的学习积累很重要再厉害的百米冠军也要从走路开始学起平时你可以通过学习来培养自己逻辑分析、数据分析的能力。这里我推荐两本书一本叫做《数据化决策》_道格拉斯 · W · 哈伯德 著_一本叫做《深度思维》尤其是第一本书对我影响很大。
另外,你也要刻意练习自己的思辨思维,之前我看过一句话说,“思辨能力的缺乏,是一种新的无知”,深以为然。比如说前面我举的研发事故的例子,其实就是典型的思辨能力,罚钱的时候,有人提出“干的多错的多“,那你能不能思辨的去看这事,而不是非得别人提醒才行?
同样,和同事讨论问题的时候也是,上周我们在分析某个业务问题的时候,有同事说因为销售做了某件事,所以营收一下子有大幅增长。我当时就警觉性地问他,那为啥上上周销售也做了这个动作,但是收入上却没有变化呢?一番讨论之后,我提醒他说,那两件事情看着有联系,但其实只是先后顺序关系,而非因果关系。
你看,这就是一次思维练习。我在工作中,经常提醒自己,要有思辨能力。
**第****三********相信****所有的问题都可以被解决**。**如果不能解决,那一定是自己认知没到位。**
这还是一句需要辩证看待的话,你可能会说,“老乔,吹牛,你给我上个天试试?”
是的,客观上说,人的能力有上限,而问题是可以无穷大的,这也是我们常说的要有敬畏之心。但从成事的角度来说,我更愿意把所有的问题都归结于自己,所谓“行有不得,反求诸己”。
很多时候信心很重要,遇到问题,探寻本质的过程中迷惘很正常,不要着急,相信真相就在那里。感受、思考、总结、验证,循环往复,只要不放弃探寻,本质一定会有一天浮出水面。
说了很多,其实还是挺抽象的。没办法,咱们聊的就是一个抽象的话题。那么,我再问问自己,**看透本质这件事,究竟难在哪?**
我认为,最难的是坚持,这是真正的门槛。从质疑研发团队的处罚措施,到得出新的结论、建立新的认知,并没有占用我太久的时间,但接下来的几年间,我都在不同的公司内对所思所得进行实践、验证和复盘。这是一种时间上的连续投入,很多人都没能做到。大家往往习惯了草率下结论、草率验证,并对待调整的部分不闻不问,错便错了。
作为一种能力,其本身也需要长时间的锻炼。关于研发事故的思考,只是众多事例之一。个人发展,需要看透本质;企业发展,需要看透本质。事事都需要对本质内涵的洞察,都需要不断重复以上五步。实践过程大概率是苦兮兮的,纠结、疲累,一点都不高大上,在认知上的推翻重建时有发生。在时间的维度上,其跨度可能长达十年、二十年,乃至终生。
对于我本人来说,苦归苦,但也乐在其中。如果你也想学习看透问题的本质,并愿意站在时间的宏观角度验证它,不妨从现在就开始实践。若在实践中遇到困难,欢迎在评论区提问、讨论,我相信,交流能创造更大的价值。