top

【故障说明】6月27日阿里云故障说明

发布时间 :2018-06-28 21:10
因阿里云业务出现故障,我司第一时间进行资源监控检查,通知了涉及此次受波及的客户,并且使用手机短信、邮箱通知。部分客户产品OSS、AK连接失败。当天部分客户的服务因受到影响有所拖延。

下文截取阿里云公告通知:

6月27日下午,我们在运维上的一个操作失误,导致一些客户访问阿里云官网控制台和使用部分产品功能出现问题,引发了大量吐槽。故障于北京时间2018年6月27日16:21左右开始,16:50分开始陆续恢复。

经过紧急技术复盘,故障原因如下:
当天下午,工程师团队在上线一个自动化运维新功能中,执行了一项变更验证操作。这一功能在测试环境验证中并未发生问题,上线到自动化运维系统后,触发了一个未知代码bug。错误代码禁用了部分内部IP,导致部分产品访问链路不通。 后续人工介入后,工程师团队快速定位问题进行了恢复。
 

受影响范围包括阿里云官网控制台,以及MQ、NAS、OSS等产品功能。
 

对于这次故障,没有借口,我们不能也不该出现这样的失误!我们将认真复盘改进自动化运维技术和发布验证流程,敬畏每一行代码,敬畏每一份托付。



                                                                                                                                                                                      阿里云计算有限公司
                                                                                                                                                                                          2018年6月27日

 

上一篇:没有了


进度可查
闪电响应,服务可视
价格透明
明码标价,无隐性收费
线上平台
一站式企业服务
售后无忧
专属技术一对一服务

关注蓝企公众号

  • 技术客服15768216187
  • 服务时间
  • 周一至周日 9:00-18:00     节假日 9:00-18:00