微软云服务又一次宕机了。
美国时间周二下午,Outlook、 Hotmail、 OneDrive、 Skype 和 Xbox Live 都出现了网络故障,全球用户都无法登陆。
英国海岸和美国海岸城市的 Outlook 邮箱系统的用户受到的影响特别严重,同样悲惨的还有西欧与美国海岸线的美国 OneDrive 用户,西欧和巴西的 Skype 用户,及 Xbox 的英国、美国、西欧用户。Azure 用户的一天也不好过,一大批工程师无法登陆系统。
Xbox、Skype 和 Outlook 团队都在第一时间发布信息,告知用户他们正在积极修复。
美国当地时间下午 4 点,Outlook、 Hotmail、 OneDrive、 Skype 和 Xbox Live 都恢复正常运行,OneDrive 则在尽力抢修。
这不是微软最近第一次出现这种问题,上次是 3 月 7 日。
在 3 月初召开的 Google Next 2017 峰会上,Google 高级副总裁 Diane Greene 就云服务可靠性深入探讨。她引用 Gartner 咨询公司旗下 CloudHarmony 部门发布的报告“攻击”微软 Azure。报告里称,2016 年 Google Cloud 的宕机时间总计为 47 分钟,而作为对比微软 Azure 服务宕机时间为 270 分钟,亚马逊 AWS 宕机时间为 108 分钟。
对此微软反驳,宕机时间并不是衡量云服务可靠性的正确方式,因为微软运营的云服务规模更大,数据中心的总宕机时间必然要高于 Google。
微软称,在全球范围内,微软拥有 34 个 Azure 区,比其他任何竞争对手都要多(亚马逊为 16 个云服务区,Google 只有 6 个)。他们认为衡量云服务是否可靠的关键应该是查看每个区域不同服务的平均运行时间,而不是根据总宕机时间来确认。Azure 服务的可靠性符合其他云服务提供商测量信息,事实上在过去 12 月全球平均运行时间达到了 99.9979%。对于客户来说,运行时间才是衡量可靠性的最关键因素。
不得否认,云系统的出错在所难免,3 月初亚马逊东海岸的一个云数据中心也发生过故障,导致数千个网站和应用程序完全无法使用,全球大量的用户和公司因此陷入混乱。
微软的理由也许站得住脚,但一个月 2 次宕机可不好玩,这对微软云服务的名声有弊无利。