据储能界了解到,阿里云位于新加坡的可用区C数据中心发生火灾,导致包括Lazada和字节跳动在内的主要科技公司所托管的服务出现严重中断。截至9月11日01:46,因消防浇水持续进行,机房开始出现积水和渗漏,电路存在短路风险,新加坡可用区C 一栋机房大楼整体紧急断电,可用区C其他大楼业务网络已陆续恢复。
据阿里云发布的官方声明中事件进展显示:
9月10日,异常因新加坡机房锂电池爆炸导致火灾及升温,消防人员已到达现场处置中,云网络大部分产品及云安全产品于10:55 已完成主动切换,其他云产品服务仍在处理中
9月10日11:30 按照产品调度策略,云数据库Redis/MongoDB/RDS MySQL、对象存储OSS、表格存储OTS等云产品的高可用版本已陆续完成容灾切换。
9月10日12:15 按照产品调度策略,云原生大数据计算服务MaxCompute 已完成容灾切换。
9月10日14:40 受影响机房包间的火情已经基本得到控制,机房温度仍高。部分OSS对象存储、数据库等产品的单AZ版本,需待受影响物理机柜具备重新开机条件后恢复。其余高可用版本的云产品均已完成主动迁移。
9月10日20:04,目前火警仍未完全解除,受消防安全控制影响,运维工程师无法进入当地机房大楼,包间温度持续升高风险暂无法解除。目前机房部分网络设备在高温环境下已出现异常,影响部分云产品的网络互通。若后续温升未得到有效控制,新加坡可用区C整体脱网的可能性在增加。若您的业务部署在新加坡可用区C,我们将协助您尽快进行业务迁移。
9月11日01:46,接当地消防要求,因消防浇水持续进行,机房开始出现积水和渗漏,电路存在短路风险,新加坡可用区C 一栋机房大楼整体紧急断电,可用区C其他大楼业务网络已陆续恢复。
截止到9月11日上午10:00,尚有15项异常提示。
目前,火灾的全面损害情况和恢复时间表尚不明确。阿里云正在努力恢复正常运营,尽量减少对客户的影响。
数据中心是数据存储、处理的基础设施,其安全性至关重要。近年来,数据中心火灾在全世界范围内已造成巨大的经济损失,严重威胁人身安全。
1
孟加拉国数据中心火灾导致3人死亡
2023年10月27日,孟加拉国首都达卡一座14层的大楼发生火灾,造成3人死亡,十人受伤,该国互联网服务遭到严重瘫痪。
据悉,这座大楼内有多个互联网网关、交换中心和数据中心,火灾导致了大量的设备和物资损毁。
据报道,孟加拉国1200万宽带互联网用户中约有40%在火灾期间遭遇了网络中断,而该国1.2亿移动互联网用户中约有20%在数据和语音服务方面遇到了问题。
2
韩国SK公司数据中心火灾导致3.2万服务器瘫痪
2022年10月15日,韩国SK公司C起火后数据中心断电造成韩国国民级聊天软件Kakao Talk、主流电商平台NAVER等在内的众多网络服务中断。据《韩国时报》报道,本次火灾导致了约3.2万个服务器瘫痪,数千万用户服务受到影响——截止2021年,韩国人口约为5200万。
一天之后Kakao Talk等服务才开始陆续恢复。数据中心客户表示,由于损失了大量服务器,恢复过程比预期的要长。
调查发现,安装在地下三层电气设备室的5个电池机架全部烧毁,电池和机架附近似乎因电气因素失火。
3
Web NX美国犹他州数据中心火灾
超360万个网站故障
2021年4月,美国主机托管公司Web NX位于犹他州的奥格登数据中心发生火灾。
该火灾导致超360万个网站出现故障,约1.5万名客户的资料受到影响,部分客户数据完全丢失且无法恢复。
4
OVH数据中心火灾致使法国政府瘫痪
当地时间2021年3月10日,欧洲云计算巨头OVH位于法国莱茵省首府斯特拉斯堡的数据中心发生严重火灾,OVH在该区域拥有的4个数据中心全部暂停服务。
4座数据中心中,一座被完全烧毁,一座的服务器损毁了三分之一。
起火后,瘫痪的法国政府、企业与公共事业网站达到约360个,一些游戏开发商在欧洲的业务也受到影响,部分位于该数据中心的服务器被烧毁,其中游戏《Rust》表示,25台欧洲服务器完全损毁,没有备份,数据无法被修复。
尽管OVH短时间调查后解释,此次起火可能因UPS引起,但一年后法国官方事故调查机构的发布的报告显示,灾难更大可能是由电力室逆变器周围的湿气引起的。
5
谷歌数据中心电气爆炸造成3人严重烧伤
当地时间2022年8月8日,位于美国爱荷华州康瑟尔布拉夫斯的谷歌数据中心发生爆炸,造成3人受伤。
媒体报道,3名电工在数据中心大楼附近的变电站工作时,突然发生了电弧闪光(电气爆炸),导致三名电工被严重烧伤。事故发生后,多个地区的谷歌地图、谷歌搜索出现中断服务情况,有数据显示,该故障影响了全球40多个国家/地区的至少1338台服务器,包括美国、澳大利亚、南非、肯尼亚、以色列、南美洲部分地区、欧洲和亚洲部分地区。
谷歌证实了这场意外为电力事故,但未披露具体原因。
数字时代,数据中心的底座作用毋庸置疑,而包括火灾在内的事故严重威胁数据中心安全,将造成巨大的损失。
数据中心相关方应加强协同合作,从设计、建设、运维、监管等方面进行优化发展,提高数据中心的可靠性和可恢复性,减少数据中心的事故发生率和影响范围,为数字化、智能化的发展提供安全保证。
评论