今晚吃完晚饭,八点左右看了一部吴孟达出演的电影《天若有情》,是刘德华和吴倩莲主演的。里面有达叔的精彩表演。达叔就是凭借这部电影中太保一角获得金像奖最佳男配角。达叔已经去世,看这部老电影是为了缅怀他老人家。

看完电影,拿起手机见到孙哥在微信上给我留言,说他和手下在生产环境部署更新时犯了一个大错误。我赶紧和孙哥通电话。

在电话里,他详细描述了事情经过。原来他手下人做系统部署时,不小心把staging环境的配置文件给部署到生产环境,从而导致核心服务挂掉了70多分钟。为此,他被大老板劈头盖脸一顿训斥,让他自己去看Dashboard上的红色告警。客户报了50多个二级告警。这也是半年来他第二次弄挂核心服务了。

从电话里面听出孙哥有点心烦意乱。他需要明天在大部门五六十人的大会上做事故分析报告。他担心因此会被老板裁员,于是我在电话里安慰了他一番。

  • 像这种时间紧、任务重的部署,本身是很容易犯错的。老板对这种情况估计也心中有数

  • 他能在一个多小时修复问题,也说明他对核心服务是有掌控能力的

  • 另外,这个重大事故的解决,也是一次宝贵的经验教训。经验教训本身也是很值钱的,老板不会看不到这个教训的成本。老板不会因为他的无心之过而裁掉他。

在电话结束前,我建议孙哥万一老板日后还是给他小鞋穿,那咱们就在公司内部换个组,眼不见为净。或者干脆刷题换一份工作到其他公司。这种费力不讨好的活,谁爱干谁去干,三年多都没轮到升职加薪,跳槽也是一种选择。作为软件工程师一生的黄金工作时间,也就这十来年了。

打完这通电话,我也反省了一下自己最近的工作经历。作为一名资深软件工程师,今后上线提交代码变更时,一定要反复测试,一定要慎重部署。部署过程最好是分步进行,一旦情况有变,还能及时回滚到原先版本,把风险控制在可控范围之内。

人的一生总会经历一些坎坷与风浪,在遇到困难,或者处理紧急情况时,我们要遇事不慌,学会沉着应对。在解决完问题之后,我们也要做复盘:哪些是我们做的比较好的,哪些是我们不足的地方,哪些是还可以做得更好的地方。在下次遇到类似情况,我们就会有可能做得更好。我们个人的应变能力也会随之成长。

在关键时刻能扛事,也会增添我们在工作中的好口碑。平时我们要做多种演练,才能有充分的预案去应对。就像战士一样,平时多流汗,战时少流血。

这周加班好几次,觉得自己的身体和精力都有些吃不消了。我现在特能理解戴哥每天都跑五英里的初衷了。作为一名FANNG公司的资深员工,他每天除了工作八小时外,还在拓展自己的个人事业。没有一个强壮的体魄和充沛的精力,还真是做不到高强地的开发工作。他每天的代码量比我一周的量还多。对于他的自律与坚持,我只能挑大拇指头,佩服佩服!