腾讯云故障持续87分钟,1957客户报障,原因曝光

科技 2024-04-14 11:21 阅读:39

腾讯云在2024年4月8日下午遭遇了一场持续87分钟的服务故障,导致1957个客户报障。故障的根本原因在于版本变更管理不足,未能有效执行沙箱验证和预案演练,暴露了在变更管理上的不足。这一故障引发了云API异常,进而影响了控制面服务,导致网页显示504错误,让客户无法登录控制台。

从客户的角度来看,云服务可以分为数据面和控制面。数据面承载客户自身的业务,而控制面负责操作云上不同产品。控制面的故障会导致管理能力不可用,但已入住的客房不受影响。腾讯云方面表示,已经配置好的服务器等IaaS资源以及非云API方式提供服务的PaaS和SaaS服务没有受到影响,但使用API提供服务的产品受到了不同程度的影响。

腾讯云表示将从提升系统韧性、强化变更管理与保护措施、增强故障响应与沟通能力三方面进行改进。这次故障引发了行业人士对云服务问题的关注,类似的故障频繁发生,如支付宝、腾讯视频、滴滴App等都曾出现过短暂的故障。这些故障提醒着云服务提供商在追求市场规模的同时,不能忽视基础运维与数据安全工作。

腾讯云这次故障给云服务行业敲响了警钟,提醒着各大云服务提供商要加强系统管理和变更管理,保障客户的数据安全和服务稳定。希望未来能够减少类似故障的发生,让云服务更加可靠稳定。