宕机似乎有个圈,亚马逊完事后就是微软Azure

中金控(www.zjkill.com):宕机似乎有个圈,亚马逊完事后就是微软Azure

近段日子以来,不断有网络服务发生宕机的情况,前有阿里系软件发生无法访问,后有亚马逊因为优惠过大被羊毛薅挤到无法访问。昨日,微软Azure在全球范围内出现了大面积宕机,从北京时间凌晨3点43分开始,到5点30分才完全恢复,整个过程秩序了将近2个小时。受Azure宕机影响,包括Microsoft 365,Dynamics和DevOps在内的微软主要服务均出现使用问题。

21a4462309f79052db801152df0213ce7acbd531.png

微软官方发布公告表示,本次出现全球性宕机问题是由于“名称服务器授权”问题所导致的。微软解释称,“工程师确认是由于影响DNS解析的名称服务器授权调整影响底层root,并影响下游对计算,存储,应用服务,AAD和SQL数据库服务。在将旧DNS系统迁移到Azure DNS期间,Microsoft服务的某些域未正确更新。在此事件期间,没有客户DNS记录受到影响,并且整个事件期间Azure DNS的可用性保持在100%。该问题仅影响Microsoft服务的记录。”

nEO_IMG_u=881953991,398894116&fm=26&gp=0.jpg

在宕机这事上,微软已经遭遇过多次。2016年,全球DNS中断影响了许多基于Azure的服务,包括SQL数据库,应用服务/ Web应用,API管理,服务总线,HDInsight,媒体服务和Visual Studio团队服务。今年,由于类似的中断,许多Office365用户无法访问其邮箱。

nEO_IMG_timg.jpg

据悉,知名市场研究机构Gartner旗下的CloudHarmony网站通过对48家云服务商的宕机故障发生的次数和时长的监测来追踪服务商的服务运行情况。根据CloudHarmony的某30天统计数据显示,全球前几名的公有云厂商中,微软Azure欧洲的一个可用域出现了54.97分钟的宕机,而亚马逊EC2在美国东部的一个可用域宕机34.3分钟,阿里云位于日本的可用域出现了9.9分钟宕机。


对于本次宕机原因,微软方面称,尽管工程师在几个小时内确定并解决了该问题,但是一些访问具有错误配置的域的系统存储了该信息,从而导致更长的恢复时间,直到错误的缓存过期。也就是说,微软仍在调查这个问题,并承诺将在72小时内发布详细的根本原因分析(RCA)。对于国内用户来说,此次宕机未有重大影响,而国外用户则是“损失惨重”。



      中金控(zjkill.com)提醒:本网站转载【宕机似乎有个圈,亚马逊完事后就是微软Azure】文章仅为流传信息,交流学习之目的,其版权均归原作者所有;凡呈此刻中金控的信息,仅供参考,本网站将尽力确保转载信息的完整性,如原作者对中金控转载文章有疑问,请及时联系中金控,中金控将积极维护著作权人的合法权益。

      这篇文章的标题是【宕机似乎有个圈,亚马逊完事后就是微软Azure】,喜欢的朋友,别忘了转载哦!
赞助商