在SSL證書過期導致全球性服務故障之后,微軟已經成功修復Windows Azure云。
在太平洋時間周六山谷萬,微軟表示99%的受影響服務已經恢復上線。Windows Azure Services Dashboard上發布的消息稱:“未來24小時,我們將繼續監控存儲服務和SSL流量是否運行正常。在此期間,客戶可能會遇到間歇性故障。”
這次全球性服務中斷持續了大約12個小時,之所以發生是因為微軟沒有更新一個安全證書。
存儲方面的故障導致了Azure其他關鍵部分的級聯性故障,甚至使得部分Xbox Live組建失效。
未來幾天,微軟將不得不向客戶解釋為何關鍵安全證書會失效并同時導致全球所有安全存儲服務中斷。
一些客戶可能難以平息:去年2月Azure服務就中斷過8個小時,同樣是由于證書問題。
業內人士一方面對微軟表示懷疑,另一方面也抱有同情,很多人問微軟為何會犯這樣一個最基本的錯誤。
作為微軟Azure競爭對手Amazon Web Services的主要客戶之一,Netflix在兩年前開發了一個名為“Netflix Security Monkey”的軟件包,可以自動檢查AWS云的證書以避免類似故障,該公司首席技術官Adrian Cockcroft通過Twitter這樣說道。