 

當前位置：存儲在線-存儲專業媒體  技巧  正文

Amazon EC2故障：都是云惹的禍？

2011-05-24 分類：技巧

4月21日發生的Amazon EC2故障事件現在已廣為人知。一般情況下，發生這樣的事件，受到指責、責備是再所難免，更有可能被訴諸法律。但到事情發展到最后，許多人和企業都將其歸咎于云計算，一致認為使用云計算存在著太多的隱患。不過，在筆者看來，這可不是一個正確的結論。此言從何說起呢？

首先，一般的云服務尤其是Amazon在過去三年里取得了非常好的成績，它們促成了以前不可能存在的新業務模式。不管是大型企業還是小公司都在不斷的借助于云服務提供大部分的IT基礎設施架構。其中一些公司還表示，如果沒有類似Amazon提供的云服務，他們簡直就不能生存。

Amazon故障的消息之所以會受到廣泛的關注是因為現在有許多的公司都依靠這類型的服務發展業務，尤其是許多公司都選擇了Amazon。Amazon曾在2009年7月自豪的宣布當時有1400家公司使用了EC2服務進行關鍵業務的運營。至此之后，使用云計算的公司數量就以指數級速度爆增。

我們不應該指責云提供商的第二個原因在于他們并不需要對其服務的使用方式負責。一些人爭論表示類似Amazon的提供商應該了解正在托管的服務，并防止“重要”的應用使用Amazon Web Services （AWS）開啟。雖然這個理由看似很有說服力，但還需要細細推敲。

這個問題同樣可以詢問ISP（互聯網服務器提供商）、電信甚至是公共服務提供商。如果所依賴的服務沒有得到充分的計劃，服務提供商應該負責嗎？如果公共事業服務商沒有預防災難的應急通信和電力計劃，他們應該阻止一家醫院使用使用電話或電力服務嗎？

相信大部分人和大部分法院的答案都會是“不”，事實上，這些服務提供商對其他人關于預防災難的不作為是沒有責任的?；ヂ摼W服務提供商對數據流誤用也是不用承擔責任的，就像電信公司不用對犯罪分子使用其電話負責一樣。

最后，我們不應該太快判決Amazon和其他云提供商的最重要原因在于，這又一次說明了人是關鍵環節。這次及其他故障都向我們揭示了這樣一個道理：沒有任何東西可以取代聰慧的人類和災難恢復計劃。

在近期這個事件發生期間，能夠持續使用Amazon EC2的企業也有數千余家。這些企業選擇了Amazon高可用功能，比如自動故障恢復和交換可用區域，能夠繼續保持業務的正常運營。僅運行Amazon EC2的高知名度企業包括了Netflix，以及其他保持正常在線的數千家企業。

云計算并不能減輕對計劃的需求，反而更加強調該需求。隨著云計算的遷移， IT架構師、首席技術官和首席信息官的價值只會越來越重要。

這并不是服務提供商遭遇的第一次故障，也不會是最后一次。任何人都不希望聽到數據中心發生故障的消息，特別是IT人員。這兩者的唯一區別是單一的事件同時暴露了眾多設計不良的應用。

引用Amazon自有的設計準則，建立在EC2之上的優良設計構架能夠保持重要信息（數據庫、日志文件等等）可易于管理持久穩固且冗余的數據存儲，能夠進行快照、復制、分離并連接至新服務器。

真正唯一的失敗是沒有為本地故障作計劃。Amazon提供了地區和這些地區的可用區域。具體說來，在北美地區，Amazon為東部提供了三個區域，為西部提供了三個區域。最近的故障只涉及美國東部一區的系統。

運行良好的公司已經設計了可供數十年的高可用性系統。Amazon幾乎提供了容錯系統所需的所有工具，但設計妥善的應急計劃、部署具有彈性和容錯的IT架構還是操之于使用這些服務的公司。

結語

正所謂吃一盞長一智，對于哪些還不了解IT架構和規劃重要性的人來說，這必將是一個分水嶺。Amazon故障事件從另外一個側面也體現了大大小小的公司采用這些服務的速度之快。

云計算和IT服務提供商能促成新的業務模式，同時也允許現有業務簡化運營。在未來新的時代里，IT不再是一個必須內部提供的資本密集型功能。云服務提供商具有更多的選擇性和靈活性，但是這些選擇也意味著更多的責任。

現在的形勢依然是為提供關鍵任務IT，公司必須尋找和留住有才能的IT人才。動態業務將越來越依靠IT和提供這些服務的專業人員。

總而言之，人是最為重要的，而Amazon EC2故障事件是不是也應該被當做一次教訓？

未經允許不得轉載：存儲在線-存儲專業媒體 » Amazon EC2故障：都是云惹的禍？

分享到

EC2 云云存儲

zhuyu

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走