亚马逊 AWS 宕机原因公布:自动化服务出现 Bug,导致网络过载

IT之家12月 12日消息 , 12月 7日 , 亚马逊 AWS 云服务出现宕机 , 导致部分互联网服务离线数小时 。
近日 , 亚马逊已经查明了本次宕机的原因 , 一项自动化过程导致了中断 , 该中断始于美国东部时间上午10:30左右 。

亚马逊 AWS 宕机原因公布:自动化服务出现 Bug,导致网络过载
文章图片

文章图片

据解释称 , 一项用于 AWS 主网络中的自动化容量扩展服务出现错误 , 触发了内部网络大量客户端的意外行为 , 这导致连接活动大量涌现 , 使内部网络和 AWS 主网络之间的网络设备不堪重负 , 并最终导致网络之间的通信延迟 。
这个错误甚至影响了亚马逊修复该问题的能力 , 它阻止了运营团队使用实时监控系统和内部控制 , 不得不使用日志来查明发生了什么 。亚马逊指出 , 服务启动直到美国东部时间下午4:34才开始改进 , 问题在美国东部时间下午5:22完全解决 。
IT之家了解到 , 由于亚马逊的支持联络中心也在 AWS 网络上运行 , 因此客户在中断期间的七个小时内无法创建支持案例 , 马逊服务健康仪表板也受到影响 。
【亚马逊 AWS 宕机原因公布:自动化服务出现 Bug,导致网络过载】来源:IT之家