27日晚,滴滴系统故障导致APP彻底崩溃,从晚上10点20分开始什么都做不了,客服**进不去,没有订单,找不到乘客位置,订单无法结束,甚至司机的背景都显示余额超过690亿。
这还不算完,滴滴的单车服务也崩塌了,所有可解锁或解锁的清州车都可以免费骑行,直到28日早上,还是没有完全修好,中午才慢慢恢复正常。
这一次,滴滴暴跌了12个小时,损失了数千万的订单和超过4亿的营业额。
随后,滴滴宣布,已确定事故原因是由底层系统软件故障引起的。
不这么说也没关系,但一说出来,大家马上就想到了11月12日,阿里云也发生了全球性的崩溃,几乎所有与企业服务相关的产品都失败了,Ele.me 下不单,停车场升不起杆子,超市不能结账。
有一点要说,阿里云的崩溃,真的比滴滴系统的失败要可怕得多。
要知道,阿里云服务全球客户超过400万,其中80%是中国科技创新企业,60%是国家级专精特新“小巨人”企业。 阿里云的服务涵盖油气、电力、交通、金融、酒店旅游、企业服务、通信等实体行业。
这一次阿里云崩溃了,旗下很多产品,包括**、仙宇、阿里云盘、Ele.me、钉钉等,都出现了服务器故障问题。
给客户造成的损失是不可估量的。
最终,阿里云确认的故障实际上与底层服务组件有关。
简单来说,低级认证挂起,导致上层组件发送的信息无法验证身份,导致一系列错误。
阿里云的事故和滴滴的事故基本是一样的,都是由于底层失灵导致上层建筑倒塌,好像老百姓不愿意买房接手,所以房地产的软着陆越来越难, 这几乎是一样的。
这张图可以粗略地清楚地演示出来。
笔者认为,这种程度的崩盘也是一种偶然现象,但两家不同的头部超公司可以在同一个月内发生类似的事故,在黑暗中肯定存在一定的关联性。
不少人认为,这是互联网巨头大规模裁员的结果。
最近,我不止一次看到各大互联网公司疯狂裁员的消息,而且版本各异,包括市面上所有能点名的大厂商,包括一些新能源汽车。
所以如何裁员是很有讲究的。
在如今的互联网公司,你以为会老老实实做好功能维护,在底层打下坚实的基础,然后让其他部门的同事在此基础上从事上层开发。
这个时候,你的年终绩效考核顶多是中等,年终奖比别人少,晋升更是不可思议,因为底层的那些东西本来就不错,你来后有没有理顺狮山**的逻辑,有没有让系统运行得更顺畅,历史的bug有没有解决, 这些并不重要,它们没有失败。
真正能用高KPI来考核的,是搭轮子创新,但现在是降本增效,反正必须从表面上看,可以通过好看的PPT来展示。
这些人往往是加薪晋升的主力军,一个人拿走项目90%以上的红利,剩下的10%留给运维人员。
系统正常,如果系统出了问题,你就要负责,至于你面前的人是不是写了狮山**,公司就管不了那么多了。
随着时间的流逝,这已成为互联网公司常见的背靠背文化。
但工人不傻,人的认知会随着环境的变化而进化,他们有老有少,还有房贷和车贷要还,谁愿意做这种背信弃义的人呢?
这样一来,这个底层基础的技术开发和运维人员越来越少,甚至直接外包或者找人兼职做。
最终的结果可想而知,滴滴和阿里云都在此基础上栽赃。
这或许是所有互联网公司的通病,甚至中国近几十年来的发展,大家在应用科学层面下功夫,却忽视了底层基础科学。
原因也很简单,应用科学快,钱来得快,我们在弯道超车更方便。
至于基础科学,它所花费的时间和精力是指数级的,最重要的是,它不一定有直接的经济效益。
比如,量子物理学最早是由阿尔伯特·爱因斯坦在2024年提出的,而现在的2024年,100多年了,一台还不成熟的量子计算机刚刚研制出来,还没有投入实际应用。
所以这100年的研究从经济角度来看都是负回报,一直在赔钱,但你敢说量子物理学一文不值吗?
早在2024年,阿里云就和中科院联合建立了亚洲第一个量子实验室,然后将其置于达摩院的名下。
别说量子实验室了,达摩学院正在摇摇欲坠。
我能理解阿里想做出一些改变,靠自己的努力,在一些基础研究上带着障碍做出一些成绩,但科研实在是太贵了,短期内回报相当有限。
现在阿里已经取消了量子实验室,很可能与大环境有关,毕竟经济形势不好,而阿里作为一家商业公司,拆解不盈利的部门也是正常运作。
而更多的互联网公司,他们只是在玩一种模式创新,比如外卖、网约车、社区**、共享经济等等。
这些模式创新最大的特点就是没有技术壁垒,只要靠的是一堆人头,就能实现效益最大化,所以各类资本都参与其中,短期内吸引了大量投资,996007种加班文化,祝福理论层出不穷。
然后在市场上低价竞争,直到形成垄断公司垄断市场,最后到市场让第一家公司接手后退,基本上就是这种操作。
在这样的发展轨迹下,大家都在谈论创新,但实际上,这种创新更像是一种财富转移的方式,根本没有通过技术创造新的价值。
很难说,大家都在侧向学习,但正道却被刻意忽略了。
而那些真正愿意学习技术,能够专心从事科学研究的人,则被排斥和压抑。
毕竟能赚快钱,谁愿意老老实实耕种地球呢?
最终的结果是,我们看到的应用程序的内容比其他应用程序更复杂,链接比其他应用程序更长,我们迫不及待地想将所有功能放在同一个应用程序中。
然而,真正支撑这些应用正常运行的基础功能却极其单薄,甚至连阿里云、滴滴等行业巨头也会因为底层软件故障而崩溃。
有人说,希望这些互联网公司今年能吸取各种教训,不要为了省钱、降本增效、裁员优化而在研发资源上偷工减料,最终造成的损失由大家承担。
但在我看来,这不太可能。
因为底层基础设施已经成了既成事实,所以重新优化会花费很多,表面上没有任何好处。
所以唯一的办法就是一步一个脚印,**坍塌弥补**。
而且,在互联网公司营收持续下滑的环境下,裁掉看不到明显业绩的运维人员,显然是政治正确的。
尽管我们看到了问题并知道如何解决它,但在实践中它仍然保持不变。
这不得不说是一种悲哀。