Future.com,北京,12月15日(记者 张炳青 苏建军)12日晚,“菜鸟APP崩溃,包裹无法正常显示,取件码和物流相关信息也看不到。 随后,菜鸟接卡码的话题出现在微博热搜上。
菜鸟公关部相关负责人告诉 Future.com 记者,“目前有一段静默期,我不能再接受采访了。 一切以公司回复为准,12日晚间新人app取件码出现短时间显示异常,经过技术生快速调查,已正常修复。 对于给您带来的不便,我们深表歉意。 ”
对于此次事故的原因,该负责人表示,“由于短暂的技术原因,维修很快就完成了。 ”
新浪微博截图。
今年以来,多款热门应用在热搜上被“坍塌”。
菜鸟并不是今年第一个因应用崩溃而登上热搜的APP,记者盘点了各大互联网厂的系统崩溃,发现2024年,唯品会、滴滴、哔哩哔哩等各大厂的APP相继下线,共计14倍。
今年3月29日,多位网友表示,唯品会倒闭,无法登录。 唯品会在其官方微博上回应称,由于短期系统故障,主站“加购”等功能可能出现异常。
B站今年两次“坍塌”,3月5日20:20左右,B站活跃用户高峰期,不少网友发现B站手机和电脑无法访问**详情页,当晚B站团队在故障20分钟后解决了问题。 6月28日下午,不少网友反映“B站倒塌”,该词条随后登上热搜。 主要受影响的是“剧”和“影视”页面,用户反映“追粉丝不断提示你无法获取**内容”、“显示页面加载失败”、“看粉丝中途无法加载”。 问题持续了大约一个小时,对于坠机原因没有具体解释。
10月23日,蚂蚁集团旗下文档编辑协作工具Yuque遭遇服务器宕机近8小时,导致**文档和官网无法打开。
今年双11后的第一天,鲜宇、钉钉、阿里云盘、饿了么、天猫精灵、菜鸟、夸克、玉阙等阿里APP纷纷无法访问或出现异常服务,“XX崩溃”迅速冲上微博热搜榜。
11月27日,多地用户反映滴滴出行APP无法使用,出现地图加载不、出租车打车不行、自行车在寒风中锁不上等情况,故障时间长达12小时。
12月3日晚,腾讯**APP出现“首页内容无法加载”、“VIP用户无法**会员**”等,相关话题立即成为热搜词。
而在12月12日晚间,不少网友反映“菜鸟APP崩溃,包裹无法正常显示,提货码和物流相关信息也看不出来”。
宕机是由系统故障、人员优化和云服务技术故障引起的。
今年的停机时间似乎特别长。 然而,并不是每个人都愿意透露事故原因。 据专业人士介绍,硬件系统故障、人员优化、云服务技术故障等都是引发宕机的原因。
据**报道,6月5日,唯品会发布《关于329机房停机故障处理的公告》。 公告显示,3月29日(00:14-12:01),南沙IDC制冷系统故障导致机房设备温度快速升高并停机,导致在线服务暂停。 事故持续12小时,造成性能损失超过1亿元,影响客户800万,判定为P0级故障。
唯品会表示,此次事故暴露了灾后恢复应急预案和风险防范措施不到位,决定严肃处理。 事故由本部门直属主管承担责任,基础平台部门负责人应予辞退职并给予相应处理。
随着行业技术的逐步成熟和规范的容灾机制,面对制冷系统,可以有效避免灾害应急响应等不可抗力因素,但这有别于因人员优化或技术原因导致运维缺乏上下游对接。
某上市科技公司硬件产品经理告诉 Future.com 记者,在这种规模的公司里,发生这么大的技术事故是非常困难的,但一旦出现,就会影响到很多人的日常生活,比如出行、办公等,大家的关注度都会比平时高。 大多数崩溃发生在他们自己的算法、硬件或他们自己的技术团队的级别。
自建技术团队的原因已经刊登在B站“哔哩哔哩科技”技术团队的公众号上,这是一篇技术分析《2021》的长文。07.13 我们就是这样崩溃的“,提到运维团队在做项目时有一个弊端,开发完成后,自测会开始灰度上线,没有专业测试团队的干预,”这个组件太核心了,需要引入基础组件测试团队,对SLB输入参数做一个完整的异常测试。 ”
或多或少与今年各大厂的人员调整有关。 据上述产品经理介绍,或多或少运维团队上下游合作可能会出现问题,现在各大互联网平台的基础设施层已经非常成熟,在存量市场下,业务并发不会暴涨,在团队稳定的前提下,类似问题应该不会频繁发生。
不过,也有业内人士质疑,技术操作失误导致的APP故障。
以11月27日的滴滴出行app崩溃为例,官方对事故原因的回应是“底层系统软件故障”。 有网友在论坛中讨论,“一个非常大的 K8S 集群进行了热升级,由于某种原因,所有的 Pod(容器)都被杀死了,而且 K8s 的元数据已经被新版 K8s 修改了,无法回滚,所以恢复时间很长。 ”
云猿数据创始人兼CEO、阿里云数据库前总经理曹伟在个人***文章中解释,这种说法并非毫无根据。 曹伟表示,滴滴团队近两个月一直在将公司内部的K8S从1改成1版本 12 已升级到 120、两个版本之间有相当大的差距。 K8S 官方推荐的方法是从一个版本到另一个版本向上爬。 然而,滴滴团队认为多次升级风险更大,并采用了跨越八个版本的直接升级策略。 曹伟认为,这种策略在理论上是可行的,但中间可能会遇到意想不到的因素,比如运维误操作,导致最终的大规模失败。
体制机制仍需不断完善。
面对同样的崩溃,各大工厂的响应速度和解决方案都不尽相同。
12月3日晚,腾讯**系统出现故障,腾讯**仅发布简短公告回应:“腾讯**出现暂时性技术问题,我们正在加紧修复,各项功能正在逐步恢复中。 ”
11月27日晚,滴滴APP系统故障,全国大面积坍塌,服务无法正常使用。 滴滴最终发表道歉声明,并解释称,中断的原因是底层系统软件故障。 滴滴也第一时间进行了较为全面的整治措施,做好了系统恢复后的各项善后工作,所有因系统故障导致的异常订单都会统一处理,并同时发放10元优惠券。
相比之下,一些大型厂商只修复bug,不做其他回应,面对用户的投诉,也不做实质性的赔偿。 上述产品经理在接受 Future.com 记者采访时表示,只有用户要求高,企业才能高质量发展,更何况目前用户要求不高,正常使用APP才是基本需求。 互联网行业进入存量市场时,要不断优化自身技术,完善抗风险机制,在关键岗位配置专人,减少人才流失。
互联网、大数据、云计算、人工智能、区块链......数字经济日益融入各领域经济社会发展的全过程,已成为人们日常生活中不可分割的一部分。 作为其中的重要一环,互联网龙头企业提供的数字公共产品和平台在一定程度上具有公共基础设施的属性。
在数字经济时代,我们面临着数据确权、数据流通、数据安全等诸多新问题,这些问题归根结底源于体制机制的不完善。 中国电子信息产业发展研究院院长张立在接受采访时表示。
事实上,这种风险在国家层面由来已久。 《网络安全法》第十条规定,建设、运营网络或者通过网络提供服务,应当依照法律、行政法规的规定和国家标准的强制性要求,采取技术措施和其他必要措施,保障网络安全稳定运行。 有效应对网络安全事件,防范互联网违法犯罪活动,维护网络数据的完整性、保密性和可用性。
第二十五条规定,网络运营者应当制定网络安全事件应急预案,及时处置系统漏洞、计算机病毒、网络攻击、网络入侵等安全风险一旦发生危害网络安全的事件,立即启动应急预案,采取相应的补救措施,并按照规定向有关主管部门报告。