6 月 27 日下午,有眾多網友在微博中反饋阿里云平臺出現了訪問故障。我們從阿里云官網公告中了解到,故障的開始時間為 2018 年 6 月 27 日16: 21 左右,主要原因為,阿里云官網的部分管控功能,及MQ、NAS、OSS等產品的部分功能出現訪問異常。不過,目前大部分功能已經恢復正常。

隨后阿里云發表了一篇故障說明,說明中阿里云表示:對于這次故障,沒有借口,我們不能也不該出現這樣的失誤!我們將認真復盤改進自動化運維技術和發布驗證流程,敬畏每一行代碼,敬畏每一份托付。

以下為阿里云故障說明原文:
6 月 27 日下午,我們在運維上的一個操作失誤,導致一些客戶訪問阿里云官網控制臺和使用部分產品功能出現問題,引發了大量吐槽。故障于北京時間 2018 年 6 月 27 日16: 21 左右開始,16: 50 分開始陸續恢復。
經過緊急技術復盤,故障原因如下:
當天下午,工程師團隊在上線一個自動化運維新功能中,執行了一項變更驗證操作。這一功能在測試環境驗證中并未發生問題,上線到自動化運維系統后,觸發了一個未知代碼bug,錯誤代碼禁用了部分內部IP,導致部分產品訪問鏈路不通。后續人工介入后,工程師團隊快速定位問題進行了恢復。
受影響方位包括阿里云官網控制臺,以及MQ、NAS、OSS等產品功能。對于這次故障,沒有借口,我們不能也不該出現這樣的失誤!我們將認真復盤改進自動化運維技術和發布驗證流程,敬畏每一行代碼,敬畏每一份托付。
特別提醒:本網內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。