重大电源Equinix宕机故障使数据中心客户大发雷霆

网络收集 1个月前 (08-20) 每天热点 128 0
广东服务器大促销查看详情

 数据中心巨头Equinix在其位于伦敦码头区的IBX LD8数据中心遭遇了严重电源故障,对一些客户而言故障持续时间长达14个小时以上——自今天凌晨大约4点30分以来,这个问题导致众多客户(包括数家ISP)无法正常使用服务,许多客户对于电力恢复过程缓慢备感沮丧。


“遭遇这种严重程度的电源故障显然是不可接受的。”


重大电源Equinix宕机故障使数据中心客户大发雷霆-第1张图片-新之洲IDC资讯

该公司在8月18日12点04分发布的首份公开声明中表示:“Equinix工程师诊断后已查明,问题的根本原因是UPS(不间断电源)系统出现了故障,我们正在与客户们合作,最大程度地减小影响。我们为由此带来的任何不便深表遗憾。”(ISP Giganet的负责人Matthew Skipsey之前称Equinix缺乏沟通,简直“糟糕透顶”。)


许多客户认为这个问题是Galaxy UPS系统中的输出静态开关出现故障。这个部件将关键负载连接到来自UPS的调节电源或来自旁路电源的原始电源。故障持续时间这么长,表明LD8的A+ B交流电馈电来自同一台UPS。期望数据中心提供商确保弹性并依靠单个数据中心的ISP们现在汲取了惨痛的教训。


与此同时,伦敦互联网交易所LINX表示,大约150个LINX成员直接受此事件的影响。(LINX的所有设备已在13点42分之前恢复正常。该组织有900余个ASN与80多个不同的国家相连接)。


重大电源Equinix宕机故障使数据中心客户大发雷霆-第2张图片-新之洲IDC资讯

受影响的一家客户是ISP Giganet。它告诉客户们:“早些时候出现故障后,Equinix及其承包商将电源系统迁移到了新的基础架构,我们仍在等待网络机架恢复供电。”

“令人遗憾的是,仍没有估计多久可以修复,这让人颇备沮丧。他们向我们保证,他们会在第一时间提供该信息。Equinix不断被催促发布最新消息。如您所知,这是一个高优先级P1问题,影响了其他运营商/ ISP的数百个系统,因此这个问题已被赋予最高优先级。”


英国电信(BT)被认为是受影响的其他运营商之一。一个客户Matthew Skipsey表示,数据中心的访问控制系统因宕机而瘫痪,“因此,一切通过双向无线电手动进行,然后从别的地方打来电话。真让人抓狂。这是超出我们合理控制范围的事件。”

重大电源Equinix宕机故障使数据中心客户大发雷霆-第3张图片-新之洲IDC资讯

Equinix称该托管设施的服务对象包括“高度集中的金融服务公司、互联网服务提供商、云及IT服务、企业以及内容和数字媒体公司”。BT是受影响的客户之一。


重大电源Equinix宕机故障使数据中心客户大发雷霆-第4张图片-新之洲IDC资讯

Equinix表示,在竭力解决问题的过程中,它“允许客户更灵活地访问LD8”,“在我们遵循新冠疫情限制的前提下工作”。


Giganet补充道:“大约凌晨4点23分,我们丢失了为2只Equinix LD8机架中的1只机架供电的两路A + B馈电。这是在UPS出现故障后发生的,Equinix的报告表明,UPS故障触发了数据中心火灾警报。断电的那只机架放置我们的核心瞻博MX路由器和思科LNS。这台瞻博MX路由器是我们的核心设备,LD8中的一切功能正常运行需要该核心设备,包括终止许多租用线路连接以及提供与vDC平台的连接。我们所有的设备电源供应商都采用了双馈电机制,数据中心提供“多种”A+B电源馈电——然而这起事件发生后,我们猜想整套系统缺乏弹性,因此解决该事件后必然会提高弹性,因为遭遇这种严重程度的电源故障显然是不可接受的。”


重大电源Equinix宕机故障使数据中心客户大发雷霆-第5张图片-新之洲IDC资讯

最新消息:似乎已在19点45分左右恢复了电源。


文章来自:云头条(微信公众号)

版权声明:部分文章内容、图片来源于互联网获取,如有侵权请联系删除,发送邮件:server889#qq.com 请将#改为@,我们将第一时间审核处理!

相关推荐

网友评论

  • (*)

最新评论

相关推荐